Как работает распознавание речи

ноября 12, 2020

Будущее распознавания речи

Первые разработки в области распознавания речи предшествовали изобретению современного компьютера более чем на 50 лет. Александра Грэма Белла на эксперимент с передачей речи вдохновила его глухая жена. Первоначально он надеялся создать устройство, которое преобразует слышимые слова в видимую картинку, которую сможет интерпретировать глухой человек. Он действительно создавал спектрографические изображения звуков, но его жена не могла их расшифровать. Это направление исследований в конечном итоге привело к изобретению телефона .

В течение нескольких десятилетий ученые разрабатывали экспериментальные методы компьютерного распознавания речи, но вычислительные мощности, доступные в то время, ограничивали их. Только в 1990-х годах компьютеры, достаточно мощные для распознавания речи, стали доступны среднему потребителю. Текущие исследования могут привести к технологиям, которые в настоящее время более знакомы по эпизоду «Звездного пути». В Агентстве перспективных оборонных исследовательских проектов (DARPA) есть три группы исследователей, работающих над Global Autonomous Language Exploitation (GALE), программой, которая будет принимать потоки информации из зарубежных новостных передач и газет и переводить их. Он надеется создать программное обеспечение, которое может мгновенно переводить на два языка с точностью не менее 90 процентов. "DARPA также финансирует НИОКР.

1:15 Однако универсальный переводчик - это еще далеко будущее - очень сложно построить систему, сочетающую автоматический перевод с технологией голосовой активации. Согласно недавней статье CNN , проект GALE «труден для DARPA [имеется в виду] труден даже по самым строгим стандартам» DARPA. Зачем? Одна из проблем - создать систему, которая может безупречно обрабатывать такие препятствия, как сленг, диалекты, акценты и фоновый шум. Различные грамматические структуры, используемые в языках, также могут представлять проблему. Например, в арабском языке иногда используются отдельные слова для передачи идей, которые представляют собой целые предложения на английском языке.

В какой-то момент в будущем распознавание речи может стать пониманием речи. Статистические модели, которые позволяют компьютерам решать, что только что сказал человек, однажды могут позволить им понять смысл слов. Хотя это огромный скачок с точки зрения вычислительной мощности и сложности программного обеспечения, некоторые исследователи утверждают, что развитие распознавания речи предлагает самый прямой путь от современных компьютеров к настоящему искусственному интеллекту. Сегодня мы можем разговаривать с нашими компьютерами. Через 25 лет они вполне могут ответить.

Для получения дополнительной информации о распознавании речи и связанных темах перейдите по ссылкам ниже.

ДЕМО VISTA SR Потенциальные проблемы с использованием распознавания речи недавно были публично продемонстрированы во время демонстрации Windows Vista. Хотя система работала безупречно при открытии программ и доступе к документам, когда дело доходило до расшифровки текста, она была не очень точной. Проблемы, вероятно, возникли из-за фонового шума и эха, присутствующего в большом зале с аудиторией, где проходила демонстрация. Видео инцидента вскоре распространилось по Интернету, подорвав репутацию Windows Vista и системы распознавания речи в целом.

Связанные статьи HowStuffWorks

Как работает электронная почта
Как работает аналоговая и цифровая запись
Как будут работать универсальные переводчики
Как работают динамики
Как работают звуковые карты
Как работают микрофоны и почему существует так много разных типов?

Больше отличных ссылок

«Еще о Белле». PBS.org. http://www.pbs.org/wgbh/amex/telephone/peopleevents/mabell.html

Поиск по этому блогу

Распознавание речи