• 11 июня, 2025

Ученые Сбера и НИУ ВШЭ научили искусственный интеллект точнее распознавать человеческие эмоции

Учёные Центра практического Искусственного Интеллекта Сбербанка и Высшей школы экономики разработали инновационную систему распознавания эмоций, которая анализирует мимику, голос и речь одновременно. Исследование под названием «Временное моделирование с использованием TCN и трансформера для аудиовизуального распознавания эмоций» (Temporal Modeling via TCN and Transformer for Audio-Visual Emotion Recognition) опубликовано в материалах международной конференции AIST’24 и представлено в статье.

Новая технология сочетает временные свёрточные сети (TCN) и трансформерные мультимодальные архитектуры, что позволяет точнее учитывать изменения эмоционального состояния во времени. Система демонстрирует рост точности более чем на 10% по сравнению с лучшими моделями, которые анализируют только выражения лиц. Такую разработку можно использовать в бизнесе, безопасности и социальной сфере.

Андрей Савченко, научный директор Центра Практического Искусственного Интеллекта Сбербанка:

«Наша система делает взаимодействие человека и искусственного интеллекта более естественным и осмысленным. Мы научились не просто распознавать базовые эмоции, но и учитывать их динамику в реальных условиях — при разном освещении, фоновом шуме и других помехах. Это особенно важно для тех отраслей бизнеса, где понимание эмоций клиентов помогает повышать качество сервиса. Наша технология уже показывает отличные результаты в тестах, а в перспективе её можно адаптировать для виртуальных ассистентов, систем безопасности и даже телемедицины. Главное преимущество — гибкость. Аудиовизуальная модель работает даже при недостаточных данных, например, когда не видно лицо или плохо слышно голос».

Разработка актуальна для кол-центров, чтобы анализировать настроения клиентов, в маркетинговых исследованиях для оценки реакции на продукты, системах безопасности для выявления агрессии или паники, образовательных и медицинских сервисах. Учёные продолжают совершенствовать модель, чтобы сделать распознавание эмоций ещё более точным и адаптивным.

Похожие статьи

Цифровизация в ДМС: «тепловая карта» брокера Remind показала, где ИИ уже снижает убытки, а где страховщики отказываются от алгоритмов

Цифровизация в ДМС: «тепловая карта» брокера Remind показала, где…

Эксперты страхового брокера Remind проанализировали данные 11 ведущих страховщиков (92% сборов рынка ДМС) и сформировали «тепловую карту цифровой зрелости» ДМС.
Пациенты с муковисцидозом в России по-прежнему сталкиваются с неравным доступом к лечению — данные мониторинга

Пациенты с муковисцидозом в России по-прежнему сталкиваются с неравным…

Всероссийский союз пациентов представил первые результаты общественного мониторинга доступности медицинской помощи людям с муковисцидозом.

Как пройти собеседование, если его оценивает ИИ

В России ИИ все чаще используют для первичного отбора кандидатов, а 14% работодателей даже проводят видеоинтервью с ИИ-ассистентами.