Re: Голос и ПК
by Евгений Викторович Арбатский - Если с синтезом русского голоса все уже достаточно хорошо, то пока не могу решить задачу распознавания русского голоса. Выяснил что за прошедшие года (в ~2002-2003) IBM продали свой ViaVoice разработчикам DragonDictate(?). Поэтому найти нормальный ViaVoice SDK под Linux не получается. А на нем были основаны различные приложения обработки звука и распознавания голоса.
Опробовал Sphinx и пока не поннял как им нормально и удобно пользоваться. Хотя вроде бы есть русские акустические модели.
Опробовал julian/julius - в quickstart наборе все запускается и распознает набор команд на английском. Но опять же не ясно как подключить свой набор команд на русском.
Задача обучения (traning) оказывается не простой - вернее не могу найти нормальное описание. Придется разбираться с существующей документацией.
Когда разберусь, то получится сделать элементарный алгоритм самообучения - при низкой вероятности распознавания можно задавать уточняющий вопрос: "Вы сказали 'слово'?" и на основании точно распознаваемого ответа "Да" / "Нет" - проводить "на лету" дообучение акустической модели.
Опробовал Sphinx и пока не поннял как им нормально и удобно пользоваться. Хотя вроде бы есть русские акустические модели.
Опробовал julian/julius - в quickstart наборе все запускается и распознает набор команд на английском. Но опять же не ясно как подключить свой набор команд на русском.
Задача обучения (traning) оказывается не простой - вернее не могу найти нормальное описание. Придется разбираться с существующей документацией.
Когда разберусь, то получится сделать элементарный алгоритм самообучения - при низкой вероятности распознавания можно задавать уточняющий вопрос: "Вы сказали 'слово'?" и на основании точно распознаваемого ответа "Да" / "Нет" - проводить "на лету" дообучение акустической модели.