• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Калейдоскоп чувств»: сотрудники лаборатории представили доклады о приложениях сентимент-анализа для социально-гуманитарных исследований

Сотрудники Лаборатории выступили на конференции молодых ученых «Цифра» в социально-гуманитарных исследованиях: метод, поле, реальность?», которая проводилась с 15 по 18 ноября на базе Иркутского государственного университета.

Доклад М.А. Кириной

Доклад М.А. Кириной
ЛЯК НИУ ВШЭ СПб

Младший научный сотрудник Маргарита Кирина представила доклад "Методы сентимент-анализа в контексте социогуманитарных исследований: библиометрический обзор". Он был посвящен проблеме использования терминов "анализ тональности" и "анализ мнений" в социогуманитарных исследованиях и попытке их разведения через библиометрический анализ метаданных более чем 14 000 англоязычных статей, выгруженных из открытой наукометрической базы данных OpenAlex, с помощью программы VOSviewer. На основе анализа ключевых слов, назначаемых авторами к своим статьям, были получены тематические карты исследований, в рамках которых использовались методы сентимент-анализа. Наиболее обширные кластеры составили вопросы обработки естественного языка, анализа Интернет-контента, продуктовой аналитики средствами NLP-технологий. Количественное и качественное сравнение характерных областей применения названных методов позволило сделать вывод об универсальности термина "sentiment analysis", используемом авторами в заглавиях статей чаще, чем термин "opinion mining". Диахронический анализ теоретической литературы также подтвердил наблюдаемую в современных исследованиях тенденцию считать анализ мнений скорее целью исследования, нежели частью методологического аппарата.


Стажер-исследователь Полина Максименко выступила с докладом "Калейдоскоп чувств: исследование эмоциональности любительской массовой литературы (на материале русскоязычной электронной базы фанфикшн)". Доклад был посвящен применению моделей машинного обучения для выявления тональности фанфикшн-текстов. В исследовании были использованы Python-реализации моделей Dostoevsky, определяющей для каждого текста значения вероятности положительной, нейтральной и отрицательной тональности, и RuBERT-tiny2, дообученная для эмоциональной разметки по тегам "радость", "грусть", "страх", “гнев”, "удивление", "отсутствие эмоций". В результате применения моделей к текстам из электронной базы фанфикшн было получено общее распределение значений тональности, а также вычислены корреляции и отклонения от среднего для разных выборок (в зависимости от тематических меток, направленности и рейтинга работ). Полученные значения показали преобладающую безэмоциональность фанфикшн-текстов, что может быть связано с меньшей эффективностью применяемых моделей в случае обработки литературных произведений. Наиболее частотными эмоциями стали радость и грусть, а преобладающей отличной от нейтральной тональностью — отрицательная. Кроме того, прослеживается слабая корреляция и высокая вариативность значений тональности с тематическими метками (в отличие от рейтинга и направленности). В качестве основного вывода было приведено утверждение о необходимости дообучения моделей сентимент-анализа на размеченных литературных текстах для более эффективного применения метода на материале фанфикшн.

Приглашаем Вас посмотреть видеозаписи докладов, а также ознакомиться с исследованиями других участников! Программа конференции доступна по ссылке