Ученые НИУ ВШЭ — Санкт-Петербург представили исследования на крупнейшей конференции по компьютерной лингвистике в Марокко
Команда Лаборатории языковой конвергенции Питерской Вышки представила на международной конференции по компьютерной лингвистике (EACL) уникальный датасет для нейрореабилитации пациентов с нарушениями речи — афазией.
EACL — крупнейшая международная конференция для экспертов по компьютерной лингвистике. В 2026 году она проходила в Марокко и объединила около 2600 специалистов. В центре дискуссии ученых — использование больших языковых моделей и развитие ИИ-агентов.
Исследователи Лаборатории языковой конвергенции под руководством Анастасии Колмогоровой представили собранный и валидированный датасет аудиозаписей пациентов с афазией. Заболевание характеризуется поражением речевых центров в коре головного мозга, что приводит к полной или частичной потере речевой способности.
Анастасия Колмогорова
«В своей работе мы использовали не большие языковые модели, а эмбеддинги — векторные представления признаков звучащей речи. Наша коллега Анастасия Марголина предложила при автоматической классификации записей по типам афазий опираться на анализ как акустических характеристик, так и лексико-грамматических паттернов речи. Подход оказался эффективным: мы протестировали его на нашем уникальном датасете. В нем есть записи информантов с разными типами афазий, разной тяжести, в разных речевых ситуациях — монологах, диалогах, при чтении и пересказе. В результате нам удалось достаточно хорошо классифицировать аудиозаписи пациентов по типам афазий и по степени тяжести нарушения. Многие коллеги оценили наш практико-ориентированный подход. Результаты исследования мы планируем протестировать на клинических площадках. Это поможет снять часть нагрузки с логопедов: они смогут проводить занятия с пациентами в полуавтоматическом режиме и точно отслеживать клиническую динамику», — рассказала Анастасия Колмогорова.

Результаты исследования Лаборатории языковой конвергенции опубликованы в крупнейшей научной библиотеке в области вычислительной лингвистики. Датасет поможет в дальнейшем тренировать искусственный интеллект и создавать мультиязычные модели для более точной диагностики заболеваний.
Анастасия Колмогорова отметила, что конференция показала мировой тренд на использование больших языковых моделей в медицине и когнитивных науках. Эксперты подчеркивают, что уже в самом ближайшем будущем ансамбли разных ИИ, дополняя друг друга, будут анализировать клиническую картину пациентов.
«Мы много работаем с искусственным интеллектом для разных задач: и для медицины, и для детектирования эмоций, и в когнитивных исследованиях. На конференции мы убедились в правильности такого подхода. Многое удалось почерпнуть для генерации текстов, в том числе для реабилитации пациентов с афазией. На следующую конференцию мы планируем подготовить исследование в этой области», — подытожила Анастасия Колмогорова.
Марголина Анастасия Валерьевна

