Приложения с распознаванием речи |
Технология распознавания речи позволяет строить максимально дружественные телефонные IVR приложения. Во время диалога с роботом абонент осуществляет выбор в меню не только тональным набором но и а произнося голосовые команды. Естественный для человека стиль общения помогает максимально быстро предоставить доступ к желаемой информации или выполнить необходимую операцию.
Благодаря распознаванию речи появилась возможность создавать такие системы, которые было практически невозможно реализовать, имея в качестве интерфейса только тональный набор. Например, система автоматического бронирования авиабилетов по телефону подразумевает выбор из большого числа городов, и тональное меню здесь практически нереализуемо. При использовании же распознавания речи, диалог системы с пользователем может выглядеть примерно так:
Система: Назовите город вылета
Абонент: Москва
Абонент: Москва
Система: Назовите город прилета
Абонент: Хабаровск
Абонент: Хабаровск
Система: Назовите дату
Абонент: 15 июля
Абонент: 15 июля
т.е. максимально естественно и приближенно к обслуживанию оператором.
Один из ведущих производителей систем распознавания речи в телефонии, компания Vocative разработала продукт LOGOS, специально предназначенный для распознавания произвольного набора слов и фраз с заранее определенным набором возможных контекстов в телекоммуникационных приложениях:
- Навигация по информационно-развлекательным IVR-меню (информация о счете, заказ билетов, гороскопы, результаты матчей и т.п)
- Голосовое управление VAS-услугами (голосовая почта, навигация по контенту) В настояший момент компания Vocative концентрирует усилия на подготовке лучшей технологии распознавания русской речи для использования в многопользовательских приложениях в телекоммуникационном и корпоративном сегментах рынка.
Основные характеристики:
- Дикторонезависимость
- Шумоустойчивость
- Уровень уверенности (Confidence level)
- Неограниченный словарь
- Интеллектуальные алгоритмы выделения речи из звукового потока (Voice Activity Detection)
- Лингвистические алгоритмы, учитывающие особенности русского языка: фонетика, морфология, правила произношения, вариативность
- Кэширование грамматик
- Распознавание DTMF
Основные технические характеристики LOGOS:
- Поддерживаемые платформы: Windows 2000, Windows XP
- API: MRCP
- Формат звукового сигнала: 8 kHz
- Формат описания грамматик: SRGS 1.0, SISR
Распознавание речи используется в Smartphone в готовом "коробочном" решении - Smartphone Speech Attendant. Для решений класса Speech Attendant (Автосекретарь) компания Vocative разработала специальный продукт - Smart LOGOS .