Главная: Голос и ПК

Если с синтезом русского голоса все уже достаточно хорошо, то пока не могу решить задачу распознавания русского голоса. Выяснил что за прошедшие года (в ~2002-2003) IBM продали свой ViaVoice разработчикам DragonDictate(?). Поэтому найти нормальный ViaVoice SDK под Linux не получается. А на нем были основаны различные приложения обработки звука и распознавания голоса.

Опробовал Sphinx и пока не поннял как им нормально и удобно пользоваться. Хотя вроде бы есть русские акустические модели.

Опробовал julian/julius - в quickstart наборе все запускается и распознает набор команд на английском. Но опять же не ясно как подключить свой набор команд на русском.

Задача обучения (traning) оказывается не простой - вернее не могу найти нормальное описание. Придется разбираться с существующей документацией.

Когда разберусь, то получится сделать элементарный алгоритм самообучения - при низкой вероятности распознавания можно задавать уточняющий вопрос: "Вы сказали 'слово'?" и на основании точно распознаваемого ответа "Да" / "Нет" - проводить "на лету" дообучение акустической модели.

Персональная страница Арбатского Е.В.

Новости сайта

Голос и ПК