«Исторический прорыв Microsoft» был совершен с помощью российских разработчиков
31 окт 2016 20:40 #47617
от ICT
Российский рекорд на английском языке Как стало известно CNews, группа исследователей Microsoft в области искусственного интеллекта по автоматическому распознаванию телефонных разговоров удалось добиться рекордного результата с помощью методики, разработанной резидентом «Сколково», компанией «ЦРТ-инновации», входящей в группу ЦРТ, «Центр речевых технологий». На днях компания Microsoft
объявила
, что ее система распознавания речи по уровню точности сравнялась с распознаванием речи живым человеком, при этом ошибка распознавания речи составила 5,9% — то есть, более 94% слов система распознаёт верно. Такой же результат в аналогичных условиях показали профессиональные стенографисты. «Мы достигли уровня человека. Это историческое достижение», — заявил главный инженер исследовательской группы Microsoft по работе с искусственным интеллектом Сюэдунь Хуань (Xuedong Huang). Согласно данным
научной публикации
исследователей из Microsoft, наибольший вклад в улучшение результата внесло использование метода, предложенного Группой ЦРТ на международной конференции Interspeech сентябре 2016 г. в Сан-Франциско. На вопрос CNews о том, почему эксперимент производился с английским языком, Александр Затворницкий, руководитель отдела распознавания речи ЦРТ, ответил, что в русском языке в простых задачах вроде распознавания команд или дикторской речи порядок ошибки составляет 5-7%, в телефонных диалогах 15-25%. Ситуация бывает и хуже и лучше в зависимости от темпа беседы, темы, интеллигентности беседующих.
http://filearchive.cnews.ru/img/cnews/2016/10/31/101.jpg">[/url] Александр Затворницкий, руководитель отдела распознавания речи ЦРТ По словам Александра, английский является наиболее изученным и довольно простым, поскольку относится к языкам, в котором грамматические отношения, в основном, передают не словоизменением, а служебными словами. В итоге, словарь на 50 тыс. словоформ для английского - это довольно много, а для русского нужно не менее 200 тыс. По его словам, сложны флективные или аглютинативные языки (русский, арабский и другие), а также малоизученные языки. Но человеческая речь постоянно преподносит сюрпризы: например, распознавание малоизученного аглютинативного грузинского на практике оказалась не очень сложной задачей. [b]Где деньги?[/b] По словам Александра, владение даже основами технологии распознавания дает преимущества даже на нынешнем этапе: «распознавание речи используется все чаще на мобильных устройствах, потому что из-за небольшого экрана набирать текст с помощью клавиатуры не всегда удобно. Этому способствует как развитие облачных технологий, так и увеличение мощности самих гаджетов. Технология применяется как в голосовых помощниках, так и просто для быстрого набора текста. Голосовые помощники становятся все более «умными» благодаря развитию технологий, и пользователи начинают активнее ими пользоваться. В корпоративном сегменте распознавание речи активнее всего используется в голосовых IVR и в бизнес-анализе». На российском рынке, по словам Александра, «ЦРТ-инновации» преуспели в обоих сегментах, для завоевания мирового рынка нужно развивать распознавание других языков (помимо русского): «Мы сделали распознавание английского как наиболее распространенного и намерены делать локализацию наших продуктов для него, но также наша стратегия в этом отношении – занять нишу редких языков. Мы первые сделали распознавание казахского, готовое к промышленному внедрению, и распознавание египетского диалекта арабского». В настоящее время разработки «ЦРТ-инноваций» активно внедряются в отечественной индустрии. Например, один из продуктов компании, Smart Logger II, позволяет использовать распознавание речи в бизнес-анализе. Его активно используют аналитики контакт-центров (например, в Ростелекоме) для решения таких задач, как выявление лучших и худших практик в продажах, анализ причин длительных и повторных обращений, анализ причин возникновения претензий, оценка продвижения сервисов самообслуживания, анализ соблюдения операторами скриптов и стандартов обслуживания клиентов, а также выявление причин оттока клиентов. Принцип работы алгоритма основан на первичном распознавании речи всех 100% фонограмм диалогов клиентов с операторами. Затем они анализируются по параметрам, заданным аналитиком: от поиска ключевых слов, сигнализирующих что-то конкретное, до разделения всех диалогов на тематические кластеры (используется для выявления, например, непрофильных тем обращений) и анализа эмоционального фона. [url=http://forum.cnews.ru/]CNews Forum 2016: Информационные технологии завтра[/url] [url=http://www.cnews.ru/news/top/2016-10-31_rossijskie_razrabotchiki_ustanovili_rechevoj_rekord] Ссылка на источник[/url][img]http://filearchive.cnews.ru/img/cnews/2016/10/31/101.jpg">
Александр Затворницкий, руководитель отдела распознавания речи ЦРТ По словам Александра, английский является наиболее изученным и довольно простым, поскольку относится к языкам, в котором грамматические отношения, в основном, передают не словоизменением, а служебными словами. В итоге, словарь на 50 тыс. словоформ для английского - это довольно много, а для русского нужно не менее 200 тыс. По его словам, сложны флективные или аглютинативные языки (русский, арабский и другие), а также малоизученные языки. Но человеческая речь постоянно преподносит сюрпризы: например, распознавание малоизученного аглютинативного грузинского на практике оказалась не очень сложной задачей. Где деньги? По словам Александра, владение даже основами технологии распознавания дает преимущества даже на нынешнем этапе: «распознавание речи используется все чаще на мобильных устройствах, потому что из-за небольшого экрана набирать текст с помощью клавиатуры не всегда удобно. Этому способствует как развитие облачных технологий, так и увеличение мощности самих гаджетов. Технология применяется как в голосовых помощниках, так и просто для быстрого набора текста. Голосовые помощники становятся все более «умными» благодаря развитию технологий, и пользователи начинают активнее ими пользоваться. В корпоративном сегменте распознавание речи активнее всего используется в голосовых IVR и в бизнес-анализе». На российском рынке, по словам Александра, «ЦРТ-инновации» преуспели в обоих сегментах, для завоевания мирового рынка нужно развивать распознавание других языков (помимо русского): «Мы сделали распознавание английского как наиболее распространенного и намерены делать локализацию наших продуктов для него, но также наша стратегия в этом отношении – занять нишу редких языков. Мы первые сделали распознавание казахского, готовое к промышленному внедрению, и распознавание египетского диалекта арабского». В настоящее время разработки «ЦРТ-инноваций» активно внедряются в отечественной индустрии. Например, один из продуктов компании, Smart Logger II, позволяет использовать распознавание речи в бизнес-анализе. Его активно используют аналитики контакт-центров (например, в Ростелекоме) для решения таких задач, как выявление лучших и худших практик в продажах, анализ причин длительных и повторных обращений, анализ причин возникновения претензий, оценка продвижения сервисов самообслуживания, анализ соблюдения операторами скриптов и стандартов обслуживания клиентов, а также выявление причин оттока клиентов. Принцип работы алгоритма основан на первичном распознавании речи всех 100% фонограмм диалогов клиентов с операторами. Затем они анализируются по параметрам, заданным аналитиком: от поиска ключевых слов, сигнализирующих что-то конкретное, до разделения всех диалогов на тематические кластеры (используется для выявления, например, непрофильных тем обращений) и анализа эмоционального фона.
CNews Forum 2016: Информационные технологии завтра
Ссылка на источник
Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.
Похожие статьи
Тема | Релевантность | Дата |
---|---|---|
В России совершен прорыв в создании 50-кубитного квантового компьютера | 16.58 | Пятница, 18 января 2019 |
Интерес российских разработчиков ПО к продуктам Microsoft продолжает снижаться | 14.27 | Среда, 17 августа 2022 |
Для шлема дополненной реальности Microsoft Hololens вышло первое приложение российских разработчиков | 13.83 | Пятница, 19 августа 2016 |
Совершен первый международный звонок в российских сетях 5G | 13.55 | Среда, 05 июня 2019 |
Совершен первый международный видеозвонок в российских сетях 5G | 13.55 | Четверг, 06 июня 2019 |
Депутаты передумали облагать НДС российских разработчиков ПО | 10.49 | Четверг, 09 июня 2016 |
Выручка российских разработчиков ПО взлетела до 1,7 трлн руб. | 10.49 | Пятница, 23 июня 2023 |
«Яндекс» поглотил разработчиков знаменитых российских антивирусов | 10.38 | Вторник, 08 декабря 2015 |
США ввели санкции против российских разработчиков микроэлектроники | 10.38 | Пятница, 31 августа 2018 |
Apple наказала российских разработчиков из-за «налога на Google» | 10.38 | Среда, 14 ноября 2018 |