• 11 июня, 2025
  • 5

Ученые Сбера и НИУ ВШЭ научили искусственный интеллект точнее распознавать человеческие эмоции

Учёные Центра практического Искусственного Интеллекта Сбербанка и Высшей школы экономики разработали инновационную систему распознавания эмоций, которая анализирует мимику, голос и речь одновременно. Исследование под названием «Временное моделирование с использованием TCN и трансформера для аудиовизуального распознавания эмоций» (Temporal Modeling via TCN and Transformer for Audio-Visual Emotion Recognition) опубликовано в материалах международной конференции AIST’24 и представлено в статье.

Новая технология сочетает временные свёрточные сети (TCN) и трансформерные мультимодальные архитектуры, что позволяет точнее учитывать изменения эмоционального состояния во времени. Система демонстрирует рост точности более чем на 10% по сравнению с лучшими моделями, которые анализируют только выражения лиц. Такую разработку можно использовать в бизнесе, безопасности и социальной сфере.

Андрей Савченко, научный директор Центра Практического Искусственного Интеллекта Сбербанка:

«Наша система делает взаимодействие человека и искусственного интеллекта более естественным и осмысленным. Мы научились не просто распознавать базовые эмоции, но и учитывать их динамику в реальных условиях — при разном освещении, фоновом шуме и других помехах. Это особенно важно для тех отраслей бизнеса, где понимание эмоций клиентов помогает повышать качество сервиса. Наша технология уже показывает отличные результаты в тестах, а в перспективе её можно адаптировать для виртуальных ассистентов, систем безопасности и даже телемедицины. Главное преимущество — гибкость. Аудиовизуальная модель работает даже при недостаточных данных, например, когда не видно лицо или плохо слышно голос».

Разработка актуальна для кол-центров, чтобы анализировать настроения клиентов, в маркетинговых исследованиях для оценки реакции на продукты, системах безопасности для выявления агрессии или паники, образовательных и медицинских сервисах. Учёные продолжают совершенствовать модель, чтобы сделать распознавание эмоций ещё более точным и адаптивным.

Похожие статьи

Бренд «Росгосстраха» №1 по узнаваемости у россиян

«Росгосстрах» остается top of mind — самым узнаваемым страховым брендом страны. Это подтвердило исследование компании Khatutsky.

В СберИнвестициях назвали главные тренды первого полугодия на фондовом…

В первом полугодии 2025 года инвесторы предпочитали длинные облигации с фиксированным купоном. Доля акций в объёме нетто-покупок за второй квартал выросла…

155 выпускников Российской экономической школы получили офферы на работу…

Сбер пригласил на работу 155 талантливых выпускников Российской экономической школы (РЭШ). Ректор Российской экономической школы Антон Суворов вручил им дипломы и…