Искусственный интеллект научили слушать нескольких людей одновременно [ Редагувати ]

В лаборатории компании Mitsubishi разработали технологию, позволяющую распознавать речь от двух до пяти одновременно говорящих человек.
Благодаря разновидности технологии машинного обучения, которая называется "глубокий кластеринг", система учится выделять характеристики голосов, отличающие говорящих друг от друга, и по ним различать речь одновременно говорящих людей.
Систему обучали с помощью образцов речи 100 носителей английского языка, но представители Mitsubishi утверждают, что система справляется и с обработкой других языков, в том числе японского.
Если двое говорят в один и тот же микрофон, система разделяет их слова с 90% точностью. Показатель падает с увеличением числа спикеров: для троих он равен уже 80%. Во время испытаний система с приемлемой точностью распознавала речь до пяти одновременно говорящих человек.
Ей также лучше, чем традиционным системам распознавания речи, удается распознавать голоса отдельных людей в шумных местах; сейчас специалисты компании работают над внедрением системы в шумные машины с голосовым интерфейсом - лифты и кондиционеры.
Авторы разработки говорят о двух потенциальных сферах применения технологии: первая - устройства с голосовым интерфейсом (компьютеры беспилотных автомобилей, персональных помощников), вторая - расшифровка аудиозаписей. Второй возможностью могут заинтересоваться спецслужбы, полиция и военные, считают в Mitsubishi.
Тем временем Intel и Lenovo собираются избавить человечество от паролей.