Российский разработчик программных продуктов и заказных решений для государственного сектора и бизнеса
Контакты
Назад к новостям

Партнер БФТ-Холдинга Компания BSS выпустила новый голос для интеллектуального помощника

Назад к новостям

Компания BSS обновила интеллектуального помощника, создав новый, максимально естественный мужской голос для консультации клиентов. Функционал реализован благодаря серьезной доработке технологии гибридного синтеза речи TTS, которая позволяет использовать аудиоматериалы общей длительностью 1-2 часа вместо 15-20 часов, необходимых ранее. Функционал доступен для заказчиков БФТ.

Технология TTS (Text To Speech) позволяет воссоздать (синтезировать) голос конкретного человека для озвучивания виртуального помощника. Например, голос диктора или известной личности, если они являются частью имиджа компании.

Экономия времени заказчиков и оптимизация их расходов стали главными задачами команды BSS при разработке новой версии. Так было подготовлено большое обновление со сменой базовой технологии обучения. Разработчики ускорили процесс создания уникального голоса, сохранили качество записи, а также сделали возможной оптимизацию расходов заказчика.

На основе технологии TTS обновлен голосовой робот BSS, который уже успешно консультирует клиентов максимально естественным голосом с человеческими интонациями. Новый мужской голос создан на основе голоса профессионального диктора, озвучившего необходимые для ведения диалогов с клиентами фразы. Озвучивание переменных данных (ФИО, улица, дата, номер и т.д.) производится на основе синтеза голоса этого диктора. Такой гибридный подход позволяет существенно сократить время на обучение модели, при этом обеспечить естественность, плавность и незаметность всех переходов и вставок.

В процессе создания нового голоса команда BSS отобрала целевую лексику, которую использует робот при общении с абонентами в реальных проектах. Это помогло отобрать необходимые фразы и тем самым сократить количество используемых для обучения модели аудиоматериалов. Более того, команда подобрала специальный фонетический корпус, в котором обеспечено максимальное разнообразие трезвучий (включая редкие), что обеспечивает естественное и приятное звучание голоса. Собранные фразы были озвучены диктором.

Обновление версии TTS позволит заказчикам при желании использовать в работе своего контакт-центра уникальный голос вместо готового базового. Технология позволяет создавать голос на основе 1-2-часовой записи любого диктора. Ранее для создания уникального голоса требовалось от 15 до 20 часов аудиоматериала.

Голосовые роботы BSS применяются на проектах, реализуемых БФТ-Холдингом, в 15 регионах страны. Они значительно снижают нагрузку на сотрудников, заменяя человека в выполнении ряда рутинных задач. Компания BSS, наш давний технологический партнер, постоянно работает над развитием своих продуктов, отталкиваясь от потребностей современного рынка и непосредственно заказчиков. Мы готовы к применению новых технологий в своих проектах.

Юлия Захаренко
Директор по маркетингу и партнерским отношениям БФТ-Холдинга

Мы смогли сократить длительность требуемых материалов с 15-20 часов до 2 часов, что позволяет нам выполнять проекты в более короткие сроки. Модель синтеза речи реализовали на новой архитектуре Conformer – это более современная архитектура нейронной сети, которая лучше справляется с синтезом длинных фраз. Если раньше мы сталкивались с «зажевыванием» в конце предложений, то теперь длинные фразы звучат корректно. Естественность и качество нового голоса, скорость его создания – важные преимущества для любого проекта по внедрению и развитию виртуального ассистента

Александр Крушинский
Директор департамента голосовых цифровых технологий компании BSS