Российские исследователи представили ряд научных работ по обработке естественного языка на конференции EACL 2026 в Марокко

В Рабате (Марокко) проходит международная конференция по компьютерной лингвистике EACL 2026 — одна из главных площадок мира, где обсуждают будущее обработки естественного языка. Исследователи Сбера из команды SberAI вместе с коллегами из ведущих отечественных технологических компаний, российских и зарубежных вузов представляют на форуме несколько научных работ. Их объединяет одна цель: дать разработчикам и учёным инструменты, которые сделают искусственный интеллект точнее, понятнее и безопаснее.

Главная новость для всех, кто создаёт нейросети с учётом русского языка, — появление первого в России мультимодального бенчмарка MERA Multi. Научная работа Multimodal Evaluation of Russian-language Architectures решает задачу, которая сдерживала развитие российских мультимодальных моделей: отсутствие методов оценки ИИ в доменах изображений, видео и аудио, учитывающих культурные особенности нашей страны. Российские учёные создали инструмент, охватывающий различные задачи и анализ изображений, аудио и видео. Теперь разработчики могут оценивать свои мультимодальные модели на открытой платформе, сравнивая результаты на публичном лидерборде. Проект создан Альянсом в сфере ИИ, в котором также приняли участие специалисты Института AIRI, НИУ ВШЭ, Сколтеха, РТУ МИРЭА и Т-Технологий.

Одна из сложнейших задач при создании систем дополненной генерации (RAG) — утечка данных, когда модель «запоминает» ответы из обучающей выборки, а не ищет их в актуальном контексте.

Исследователи предложили решение в статье DRAGOn: Designing RAG On Periodically Updated Corpus. Они создали первый динамический RAG-бенчмарк для русского языка на основе свежих новостей. Система автоматически формирует граф знаний из актуальных данных, строит вопросно-ответные пары и тем самым исключает человеческий фактор из процесса проверки. Разработанный фреймворк для парсинга и генерации данных выложен в открытый доступ — его можно адаптировать под научные статьи, посты или любые другие домены. Серия экспериментов с открытыми моделями, проведённая в ходе исследования, наглядно продемонстрировала: качество поиска в RAG-системах критически важно, и теперь у разработчиков есть надёжный инструмент для его оценки. Статья подготовлена учёными Сбера, MWS AI (входит в МТС Web Services) и других организаций.

Стремительное развитие больших языковых моделей требует, чтобы образование за ними поспевало. В работе From Standard Transformers to Modern LLMs: Bringing Dialogue Models, RAG, and Agents to the Classroom учёные предложили обновлённый курс по трансформерным моделям. В него включены темы, которые раньше оставались за пределами университетских программ: RAG (генерация с поиском), автономные агенты, мультимодальные диалоговые модели. Курс даёт практические навыки работы с ИИ-помощником ГигаЧат и знакомит студентов с актуальными российскими бенчмарками, такими как MERA, DRAGOn и LIBRA. Такой подход позволяет готовить специалистов, которые не просто знают теорию, но и умеют создавать современные RAG-системы и агентов на базе языковых моделей, востребованных в индустрии. Статья написана исследователями Сбера совместно с учёными НИУ ВШЭ, Сколтеха и Института AIRI.

Еще одна научная работа, авторами которой стали исследователи SberAI, посвящена безопасности данных.

В статье FiMMIA: scaling semantic perturbation-based membership inference across modalities представлен модульный фреймворк, который детектирует утечки данных в мультимодальных больших языковых моделях. Метод работает так: для каждого примера из датасета генерируются «соседи» — семантически близкие варианты, затем вычисляется разница в эмбеддингах и лоссах между соседями и исходным примером. Простая полносвязная нейросеть на основе этих разностей предсказывает факт утечки, а итоговое решение выносится путём агрегации по всем соседям. Важно, что подход масштабируется на разные типы входных данных — изображения, видео и аудио, — что делает его универсальным инструментом для контроля чистоты обучающих выборок.