Распознает шутки, мат и даже сарказм: Yandex Cloud представила новую нейросеть-эмпат, отличающую эмоции в речи

Новая ML-модель от Yandex Cloud способна анализировать эмоции в разговоре по голосу

Облачная платформа Yandex Cloud анонсировала разработку новой нейросети-эмпата, предназначенной для анализа эмоций в речи. Ожидается, что этот инновационный алгоритм, разработанный на базе технологии распознавания речи Yandex SpeechKit, позволит бизнесу лучше понимать эмоциональное состояние клиентов во время диалога.

Новая ML-модель (от Machine Learning, или в переводе «Машинное Обучение») уже обладает значительным функционалом: она способна распознавать негативные эмоции, неформальные высказывания и нецензурную лексику, а также определять пол спикера и его фразы в разговоре. Кроме того, в планах у компании — интегрировать эмпата с YandexGPT для распознавания более сложных эмоций, таких как сарказм.

При разработке ML-сервисов мы всегда учитываем обратную связь рынка. Один из запросов наших клиентов и партнеров — умение определять эмоции при распознавании речи. Теперь эта функция доступна каждому пользователю. В будущем в рамках сервиса речевой аналитики SpeechSense мы планируем значительно расширить список распознаваемых эмоций и дать возможность клиентам самим выбирать, какие эмоции им необходимо определять

Василий Ершов, руководитель ML-сервисов Yandex Cloud

Разработчики нейросети-эмпата полагают, что она позволит улучшить качество аналитики телефонных разговоров, адаптировать работу колл-центров под каждого клиента и оперативно реагировать на внештатные ситуации во время диалога. Так, определив, что собеседник недоволен и грубо общается с нейропомощником, нейросеть автоматом переключит на живого оператора. Модель работает в режиме реального времени, что обеспечивает оперативное реагирование на эмоциональное состояние клиента во время общения.

Видео: Yandex Cloud

Новая модель не только анализирует содержание речи спикера, но и учитывает его интонации, тембр голоса и другие параметры, что позволяет более точно определять эмоциональное состояние. Эта функциональность дополнительно расширяет возможности аналитики и позволяет оптимизировать сценарии коммуникации в колл-центрах.

Нейросеть-эмпат будет интегрирована в сервис речевой аналитики SpeechSense, включающий в себя технологии Yandex SpeechKit и YandexGPT. Это позволит распознавать более сложные эмоции спикера и оценивать его вовлеченность в разговор.

Выводя на рынок новую нейросеть-эмпат, Yandex Cloud продолжает развивать свое семейство языковых моделей на базе технологии SpeechKit.  Ранее облачная платформа представила нейросеть-полиглота, способную распознать 16 иностранных языков одновременно: английский, французский, датский, финский, турецкий и другие.

Читать материалы по теме:

В России научили нейросеть распознавать опасные предметы на изображениях

Президент России подловил искусственный интеллект на ошибке при постановке диагноза

Этот сайт использует куки