Направления научных исследований

Результаты работы в 2024 году

Компьютерная лингвистика в музейном пространстве

В рамках данного направления лаборатория сотрудничает с ведущими музеями России и осуществляет цифровизацию музейных практик.

О направлении

Создание лингвистических и филологических ресурсов

Важным направлением работы Лаборатории является разработка методологии и создание новых лингво-филологических ресурсов и интерфейсов для решения актуальных задач теоретической лингвистики и в целом гуманитарных наук, работающих с текстами.

О направлении

Разработка новых и усовершенствование существующих методов анализа эмоций в текстовых данных

В настоящее время результаты изучения эмоционального поведения с точки зрения психологии, социологии, лингвистики находят применение в прикладных областях, в частности в области человеко–компьютерного взаимодействия. Способность к автоматическому распознаванию человеческих эмоций и к эмоциональной интеракции с пользователем рассматривается как важная, но пока нерешенная задача развития электронных систем: насколько естественной является эмоциональность в коммуникации людей, настолько сложен перенос этой характеристики на общение с компьютером. Эмоция представляется непростым для изучения и моделирования феноменом, о чем можно утверждать хотя бы на основании многообразия подходов к самому определению понятия.

О направлении

Апробация современных компьютерных методов обработки больших данных, включая методы машинного и глубокого обучения, на материале созданных лингвистических ресурсов

Созданные в лаборатории лингвистические и филологические ресурсы являются ярким примером больших данных, ручной экспертный анализ которых затруднен их объемом. В связи с этим актуальным становится применение современных статистических и нейросетевых методов их исследования.

О направлении

Объектом исследования с использованием компьютерных методов становятся все собранные в лаборатории корпуса и датасеты. В лаборатории осуществялется:

1) анализ русской малой прозы (ее лексических особенностей, особенностей прямой речи, стихотворных фрагментов, эмоциональной лексики) методами автоматической обработки текста и машинного обучения;

2) применение методов искусственного интеллекта для исследования фанфикшн прозы;

3) выявление с помощью нейросетевых методов речевых предикторов успешности профессионального коммуникативного взаимодействия торговых представителей (на основе транскриптов корпуса устной речи торговых представителей);

4) применение методов глубинного обучения для задачи диалоговой саммаризации на русском языке (на материале родительских чатов);

5) автоматическое распознавание звукозаписей повседневной речи;

6) анализ тематики повседневных разговоров;

7) исследование редуцированных форм спонтанной русской речи;

8) исследование нецензурной лексики в русской повседневной речи;

9) использование больших языковых моделей для прагматического аннотирования речевого корпуса.

Исследование категории естественности устной и письменной речи в контексте задачи автоматической генерации

Задача генерации письменного текста, а также создания диалоговых ассистентов, текстовая продукция которых соответствует категории естественности, является актуальной на текущем этапе развития больших языковых моделей, которые уже "научились" создавать грамматически корректные и семантически непротиворечивые тексты.

О направлении

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.

Лаборатория языковой конвергенции

Направления научных исследований

Результаты работы в 2023 году

Результаты работы в 2024 году