Распознавание голоса

Распознавание голоса – идентификация личности по голосу, относится к системам биометрического контроля доступа. Для определения уникальных речевых особенностей конкретного человека элементы речи разбиваются на частоты, из которых в дальнейшем создается цифровая модель. Образец хранится в базе данных и извлекается системой для сравнения.

Распознавание голоса и распознавание речи – два разных типа биометрии, хотя часто их считают равнозначными понятиями. Они отличаются по своим основным задачам: распознавание речи подразумевает возможность системы обрабатывать сказанное, а распознавание голоса делает акцент на его индивидуальных особенностях и служит «кодом» доступа. 

Виды решений и область применения

Для идентификации по отпечаткам пальцев или сетчатке глаза требуется дополнительное и недешевое оборудование, а для распознавания голоса достаточно микрофона и соответствующего ПО. Голосовая биометрия не только идентифицирует личность, но и помогает избежать мошенничества. Существует два режима работы таких систем, которые влияют на области их применения.

  • Активная: распознавание происходит по определенным фразам. Чтобы избежать подмены настоящего голоса на аудиозапись, система использует случайные фразы, которые предлагает произнести пользователю. Режим может работать в условиях отсутствия связи с внешним сервером, проверяя подлинность на самом мобильном устройстве, так как цифровой отпечаток не занимает много места в памяти. Не всегда подходят для сфер, где большой поток людей (банки, страховые компании, торговые комплексы и т.п.).
  • Пассивная: распознавание происходит по свободной речи. Система «слушает» оппонента и молча сравнивает его голос с базой данных. Она проще в использовании, но сложнее в техническом обеспечении. Для вычисления мошенников используются «черные списки», которые составляют специалисты компании-пользователя. В дальнейшем организации могут обмениваться такими базами, расширяя ее. Актуально для сфер, где телефония занимает одно из приоритетных мест (например, колл-центры).

Это интересно

Устройства по распознаванию речи ведут свою историю с 1952 года. Самое первое устройство распознавало произнесенные человеком цифры, а через десять лет миру предстала разработка под названием IBM Shoebox. В коммерческое русло программы по распознаванию речи вышли в начале 90-х. Они во многом облегчили жизнь тех, кто постоянно работает с большим объемом информации, требующей преобразовать ее в текст.