Как работает распознавание речи

 

 Распознавание речи: ошибки и недостатки 

Высококачественный микрофон с функцией шумоподавления может повысить точность вашей системы распознавания речи. Ни одна система распознавания речи не совершенна на 100 процентов; несколько факторов могут снизить точность. Некоторые из этих факторов являются проблемами, которые продолжают улучшаться по мере совершенствования технологий. Другие могут быть уменьшены - если не исправлены полностью - пользователем. 

Низкое соотношение сигнал / шум 

 Программа должна четко «слышать» произносимые слова, и любой дополнительный шум, внесенный в звук, будет этому мешать. Шум может исходить от ряда источников, включая громкий фоновый шум в офисе. Пользователи должны работать в тихой комнате с качественным микрофоном, расположенным как можно ближе ко рту. Звуковые карты низкого качества , которые обеспечивают микрофонный вход для отправки сигнала на компьютер, часто не имеют достаточной защиты от электрических сигналов, производимых другими компонентами компьютера. Они могут внести в сигнал гудение или шипение. 

Перекрывающаяся речь 

 Современные системы испытывают трудности с разделением одновременной речи нескольких пользователей. «Если вы попытаетесь использовать технологию распознавания в разговорах или встречах, когда люди часто прерывают друг друга или разговаривают друг с другом, вы, скорее всего, получите очень плохие результаты», - говорит Джон Гарофоло. 

 Интенсивное использование мощности компьютера 

 Для запуска статистических моделей, необходимых для распознавания речи, процессор компьютера должен выполнять много тяжелой работы. Одна из причин этого - необходимость запоминать каждый этап поиска по распознаванию слов на тот случай, если системе потребуется вернуться назад, чтобы найти правильное слово. Самые быстрые из используемых сегодня персональных компьютеров могут по-прежнему испытывать трудности со сложными командами или фразами, что значительно снижает время отклика. Словари, необходимые для программ, также занимают много места на жестком диске. К счастью, дисковая память и скорость процессора быстро развиваются - компьютеры, используемые через 10 лет, выиграют от экспоненциального роста обоих факторов. 

 Омонимы 

Омонимы - это два слова, которые пишутся по-разному и имеют разные значения, но звучат одинаково. Наряд (одеяние) — наряд солдат; среда обитания — среда (день недели); стан (туловище) — полевой стан (место стоянки); гранатовый сок — гранатовый браслет; сушка (от сушить) — сушка (маленькая баранка). - все это примеры. Программа распознавания речи не может определить разницу между этими словами только по звуку. Однако обширное обучение систем и статистических моделей, учитывающих контекст слова, значительно улучшило их производительность. 

Далее мы посмотрим на будущее программ распознавания речи.

Следующая страница

Комментарии

Популярные сообщения из этого блога

Светодиодный индикатор уровня сигнала

Колебание жидкости в трубке.

Распознавание речи и распознавание голоса: в чем разница?