Как работает распознавание речи
Распознавание речи: ошибки и недостатки
Высококачественный микрофон с функцией шумоподавления может повысить точность вашей системы распознавания речи. Ни одна система распознавания речи не совершенна на 100 процентов; несколько факторов могут снизить точность. Некоторые из этих факторов являются проблемами, которые продолжают улучшаться по мере совершенствования технологий. Другие могут быть уменьшены - если не исправлены полностью - пользователем.
Низкое соотношение сигнал / шум
Программа должна четко «слышать» произносимые слова, и любой дополнительный шум, внесенный в звук, будет этому мешать. Шум может исходить от ряда источников, включая громкий фоновый шум в офисе. Пользователи должны работать в тихой комнате с качественным микрофоном, расположенным как можно ближе ко рту. Звуковые карты низкого качества , которые обеспечивают микрофонный вход для отправки сигнала на компьютер, часто не имеют достаточной защиты от электрических сигналов, производимых другими компонентами компьютера. Они могут внести в сигнал гудение или шипение.
Перекрывающаяся речь
Современные системы испытывают трудности с разделением одновременной речи нескольких пользователей. «Если вы попытаетесь использовать технологию распознавания в разговорах или встречах, когда люди часто прерывают друг друга или разговаривают друг с другом, вы, скорее всего, получите очень плохие результаты», - говорит Джон Гарофоло.
Интенсивное использование мощности компьютера
Для запуска статистических моделей, необходимых для распознавания речи, процессор компьютера должен выполнять много тяжелой работы. Одна из причин этого - необходимость запоминать каждый этап поиска по распознаванию слов на тот случай, если системе потребуется вернуться назад, чтобы найти правильное слово. Самые быстрые из используемых сегодня персональных компьютеров могут по-прежнему испытывать трудности со сложными командами или фразами, что значительно снижает время отклика. Словари, необходимые для программ, также занимают много места на жестком диске. К счастью, дисковая память и скорость процессора быстро развиваются - компьютеры, используемые через 10 лет, выиграют от экспоненциального роста обоих факторов.
Омонимы
Омонимы - это два слова, которые пишутся по-разному и имеют разные значения, но звучат одинаково. Наряд (одеяние) — наряд солдат; среда обитания — среда (день недели); стан (туловище) — полевой стан (место стоянки); гранатовый сок — гранатовый браслет; сушка (от сушить) — сушка (маленькая баранка). - все это примеры. Программа распознавания речи не может определить разницу между этими словами только по звуку. Однако обширное обучение систем и статистических моделей, учитывающих контекст слова, значительно улучшило их производительность.
Далее мы посмотрим на будущее программ распознавания речи.

Комментарии
Отправить комментарий