Google DeepMind — команда Google, изучающая возможности искусственного интеллекта, совместно с учеными из Оксфордского университета, разработала алгоритм, который распознает речь, наблюдая за артикуляцией человека.

Результат, полученный в ходе эксперимента, оказался лучше, чем у профессионального переводчика, считывающего речь по губам человека.

Искусственный интеллект, созданных в стенах Google, обучали на популярных телевизионных шоу, которые появлялись в эфире с 2010 по 2015 годы. За все время алгоритм поглотил 5 тысяч часов видео. Повторную проверку эффективности провели с марта по сентябрь 2016. Выборка из 200 видео фрагментов показала, что человек безошибочно распознал 12,4% слов, а алгоритм Google — 46,8%.

Это большой шаг в освоении языков и жестов, представьте себе, как удобно будет осваивать видео на других языках, интегрировать субтитры онлайн и просто распознавать речь в тех видео, где случайным образом был потерян аудио ряд.


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: