Одновременно анализировать голос, мимику и речь научили нейросеть специалисты из НИУ ВШЭ и Сбербанка

Уникальный алгоритм оказался на 10% точнее существующих аналогов

В России была разработана новая система искусственного интеллекта, которая лучше аналогов распознает эмоции людей. Уникальность этой технологии заключается в том, что она одновременно анализирует три источника информации: мимику, голос и речь. Комплексная оценка позволяет системе быть на 10% точнее, чем лучшие существующие алгоритмы, которые полагаются только на один источник данных.

Научный директор Центра практического искусственного интеллекта Сбербанка Андрей Савченко рассказал, что новая технология уже демонстрирует впечатляющие результаты в тестах. В будущем её можно будет адаптировать для использования в виртуальных ассистентах, системах безопасности и телемедицине. Одним из ключевых преимуществ системы стала ее гибкость: она способна работать даже в условиях недостатка данных, например, когда лицо пользователя не видно или голос плохо слышен.

Разработка была осуществлена Андреем Савченко и его коллегой Алексеем Андреевым из НИУ ВШЭ (Нижний Новгород). Структура системы позволяет ей учитывать изменения эмоционального состояния во времени, что делает ее более эффективной. В отличие от других технологий распознавания эмоций, новая система может обрабатывать несколько каналов информации одновременно, включая мимику, голосовые особенности и структуру речи.

По словам учёных, их разработка может быть полезна не только в маркетинге, но и в области безопасности, где ИИ может помочь выявлять агрессию или панику.

Читайте ещё по теме:

Систему машинного зрения для распознавания объектов создали учёные Института искусственного интеллекта AIRI

Медпомощника на основе ИИ создали в России

Сверхтвёрдые материалы поможет создавать ИИ: учёные из Института искусственного интеллекта AIRI представили новую разработку