Reconoce chistes, malas palabras e incluso sarcasmo: Yandex Cloud presenta una nueva red neuronal empática que distingue las emociones en el habla

El nuevo modelo ML de Yandex Cloud es capaz de analizar las emociones en una conversación a través de la voz

La plataforma en la nube Yandex Cloud ha anunciado el desarrollo de una nueva red neuronal empática diseñada para analizar las emociones en el habla. Se espera que este innovador algoritmo, desarrollado sobre la base de la tecnología de reconocimiento de voz Yandex SpeechKit, permita a las empresas comprender mejor el estado emocional de los clientes durante el diálogo.

El nuevo modelo ML (de Machine Learning, o en español «Aprendizaje Automático») ya posee una funcionalidad significativa: es capaz de reconocer emociones negativas, expresiones informales y lenguaje obsceno, así como determinar el género del hablante y sus frases en la conversación. Además, la compañía planea integrar el empático con YandexGPT para reconocer emociones más complejas, como el sarcasmo.

Al desarrollar servicios de ML, siempre tenemos en cuenta la retroalimentación del mercado. Una de las solicitudes de nuestros clientes y socios es la capacidad de determinar las emociones al reconocer el habla. Ahora esta función está disponible para todos los usuarios. En el futuro, dentro del servicio de análisis del habla SpeechSense, planeamos ampliar significativamente la lista de emociones reconocibles y dar a los clientes la posibilidad de elegir qué emociones necesitan determinar
Vasili Ershov, director de servicios de ML de Yandex Cloud

Los desarrolladores de la red neuronal empática creen que permitirá mejorar la calidad del análisis de las conversaciones telefónicas, adaptar el trabajo de los centros de llamadas a cada cliente y reaccionar rápidamente ante situaciones de emergencia durante el diálogo. Por ejemplo, si se determina que un interlocutor está insatisfecho y se comunica de manera grosera con el asistente neuronal, la red neuronal lo transferirá automáticamente a un operador en vivo. El modelo funciona en tiempo real, lo que garantiza una respuesta rápida al estado emocional del cliente durante la comunicación.

Загрузка Youtube видео...
Video: Yandex Cloud

El nuevo modelo no solo analiza el contenido del habla del hablante, sino que también tiene en cuenta sus entonaciones, timbre de voz y otros parámetros, lo que permite determinar con mayor precisión el estado emocional. Esta funcionalidad amplía aún más las capacidades de análisis y permite optimizar los escenarios de comunicación en los centros de llamadas.

La red neuronal empática se integrará en el servicio de análisis del habla SpeechSense, que incluye las tecnologías Yandex SpeechKit e YandexGPT. Esto permitirá reconocer emociones más complejas del hablante y evaluar su participación en la conversación.

Al lanzar al mercado la nueva red neuronal empática, Yandex Cloud continúa desarrollando su familia de modelos de lenguaje basados en la tecnología SpeechKit. Anteriormente, la plataforma en la nube presentó una red neuronal políglota capaz de reconocer 16 idiomas extranjeros simultáneamente: inglés, francés, danés, finlandés, turco y otros.

Leer materiales sobre el tema:

En Rusia, una red neuronal ha sido entrenada para reconocer objetos peligrosos en imágenes

El presidente de Rusia atrapó a la inteligencia artificial en un error al hacer un diagnóstico

Ahora en la página principal