Google создал читающий по губам искусственный интеллект

Google создал читающий по губам искусственный интеллект

ПОДЕЛИТЬСЯ

Искусственный интеллект Google DeepMind, разработанный вместе с учеными Оксфордского университета, научился понимать речь, следя за артикуляцией говорящего. Для сравнения: у профессионального чтеца по губам этот результат составляет всего лишь порядка 12,4%. За все время метод изучил около 5 тыс. часов видео либо около 118 тыс. предложений. Эффективность алгоритмов проверялась на новых выпусках телепрограмм, транслировавшихся с марта по сентябрь 2016-го. Для сравнения профессионалы провели эксперимент, в котором профессионально читающий по губам человек сумел распознать только 12,4% слов. При всем этом приобретенные результаты могли быть еще лучше, но в некоторых случаях аудио и видео отставали практически на секунду, что мешало ИИ правильно выстраивать ассоциативные связи. Однако когда система ИИ была протестирована с применением того же набора данных, она расшифровала практически половину слов и могла сделать целые сложные фразы.

2-мя неделями до этого в Оксфордском Университете была разработана другая система глубокого обучения, умеющая читать по губам. LipNet также был в состоянии побороть человека в точном чтении по губам, хотя набор данных GRID, применяемый в этом случае, содержал только 51 неповторимое слово, в то время как данные BBC содержат практически 17 500, в соответствии с New Scientist. Не менее очевидный сценарий — применение алгоритмов в потребительских устройствах, чтобы посодействовать Android-смартфонам понять, что им пробует сказать пользователь в шумной обстановке.

ПОДЕЛИТЬСЯ