Исследователи из Оксфорда научили нейросеть читать по губам лучше человека
09 нояб 2016 12:20 #48020
от ICT
Группа исследователей из Оксфордского университета создала первую в мире программу, способную распознавать речь по губам на уровне целых предложений лучше, чем это делают подготовленные люди. Как пишет
N+1
, работа программы основана на использовании нейросетей и методов глубинного обучения. При этом ее создателям удалось решить проблему, с которой сталкивались их предшественники: новый алгоритм способен считывать не только слова и словосочетания, но и целые предложения. Добиться такого результата ученым удалось при помощи программы LipNet, в основе которой лежит LSTM-нейросеть. Эта нейросеть представляет собой подвид рекуррентных нейросетей, для которых характерно наличие обратной связи. Ее главная особенность заключается в том, что она способна обучаться долговременным зависимостям. Помимо этого, исследователи использовали специальную сверточную нейросеть (STCNN), которая хорошо справляется с задачей анализа видео, и обучение методом нейросетевой темпоральной классификации (Connectionist Temporal Classification, CTC). Для обучения программы ученые использовали материала базу данных Grid, в которой было собрано более 32 тысяч видеозаписей. На них 13 человек произносили на английском языке предложения, построенные по одинаковому принципу, но содержащие разные варианты слов для каждой словесной категории. Всего каждое предложение имело по 64 тысячи вариантов. После того как программа научилась понимать говорящего при помощи 88% выборки Grid, качество ее работы было проверено на оставшихся 12% видеозаписей. В результате исследователи установили, что алоритм может правильно распознавать речь по губам с точностью в 93,4%. По этому показателю LipNet обошла как другие подобные программы, так и специально обученных людей, для которых показатель распознавания составляет 52,3%. Однако ученые подчеркивают, что программа была проверена в тепличных условиях, и в случае работы с произвольной человеческой речью точность распознавания по губам может быть значительно хуже.
Ссылка на источник
Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.
Похожие статьи
Тема | Релевантность | Дата |
---|---|---|
Британские ученые научили компьютер читать по губам | 24.7 | Вторник, 29 марта 2016 |
Исследователи научили нейросеть оценивать уровень бедности по спутниковым снимкам | 20.14 | Пятница, 19 августа 2016 |
Исследователи научили робота лучше захватывать предметы при помощи манипулятора-соперника | 20.04 | Среда, 07 июня 2017 |
Слепых научили "читать" обычные книги при помощи специальной камеры | 14.17 | Пятница, 11 ноября 2016 |
Исследователи научили робота охотиться за добычей | 13.91 | Четверг, 07 июля 2016 |
Исследователи научили дрон распознавать насилие в толпе | 13.76 | Четверг, 07 июня 2018 |
Нейросеть научили давать советы о любви | 13.67 | Пятница, 27 января 2017 |
Нейросеть научили взламывать пароли миллионами | 13.67 | Вторник, 19 сентября 2017 |
Нейросеть научили распознавать отретушированные снимки | 13.67 | Понедельник, 25 июня 2018 |
Исследователи научились распознавать эмоции человека при помощи Wi-Fi роутера | 13.62 | Четверг, 22 сентября 2016 |