Корпус эмоциональной речи: опыт сбора и первые выводы

В Лаборатории продолжается работа по созданию лингвистических ресурсов – коллекций устной и письменной речи! Этим летом завершился промежуточный этап работы в рамках проекта по анализу и автоматической обработке эмоциональной речи.

В прошлом учебном году стажер-исследователь Лаборатории Елизавета Куликова собирала мультимодальный корпус эмоциональной речи. Научить компьютер распознавать эмоции – одна из ключевых задач в области человеко-компьютерного взаимодействия, а для ее решения требуются большие объемы данных, которые бы служили примерами проявления различных эмоций.

Одной из главных задач и сложностей в нашем проекте был сбор таких данных, которые бы показывали максимально естественные, ненаигранные эмоции. Для этого была разработана процедура сбора видеоматериала, в основе которой – воспоминания информантов об эмоциональных ситуациях из их жизни. Мы просили участников вспомнить и рассказать о случаях, в которых они испытывали радость или грусть, злились или испугались. Погружаясь в воспоминания, человек снова так или иначе переживает эту эмоцию. Именно такие эмоциональные рассказы мы и записали. В записи корпуса приняли участие 11 человек. Сейчас объем корпуса составляет около 3 часов.

Собранные видеозаписи получили мультимодальную эмоциональную разметку: сначала аннотаторы оценивали эмоции в тексте, извлеченном из полученных записей, затем в аудиозаписях, после чего определили эмоции в видеоряде с опорой только на мимику и в конце – посмотрев видеозапись со звуком и изображением.

ЛЯК НИУ ВШЭ СПб

Сейчас на собранных данных проводятся пробные эксперименты по дообучению мультимодальных моделей автоматического распознавания эмоций.

Мы благодарим всех информантов и разметчиков за поддержку проекта!

Дата

9 сентября 2024

Автор

Куликова Елизавета Романовна
Лаборатория языковой конвергенции: Стажер-исследователь

Рубрики

Наука

Темы

исследования и аналитика разъяснение нововведения инновации

В статье упомянуты

Лаборатория языковой конвергенции