Цифровые методы в исследовании мемов: взаимосвязь между ироничностью и тональностью текста

На третьем открытом семинаре научно-учебной группы в 2022 году выступила студентка 3 курса, Ася Карышева. Доклад посвящен пилотному исследованию твитов, содержащих русскоязычные текстовые интернет-мемы, в рамках задачи автоматического распознавания вербальной иронии.

«Русскоязычные текстовые мемы в Twitter и их связь с вербальной иронией: пилотное исследование с использованием методов анализа тональности»

В начале доклада Ася рассказала о подходах к определению понятия «мем» в работах других исследователей. Было предложено следующее определение: «Текстовый интернет-мем — это слово, словосочетание или фраза, которое или которая воспроизводит себя в сети Интернет, быстро распространяется среди интернет-пользователей и обладает комичностью, доступной ограниченному числу пользователей».

Далее Ася рассказала о двух типах иронии (ситуационной и вербальной). Докладчица уделила особое внимание методам автоматического определения вербальной иронии. Было отмечено, что признаком для определения наличия или отсутствия вербальной иронии часто становится тональность текста. В своем исследовании Ася проверяла гипотезы о наличии значимой корреляции между ироничностью твита и тональностью контекста интернет-мема, содержащегося в этом твите. Анализ тональности в исследовании проводился с помощью Открытого тонального словаря русского языка КартаСловСент.

В рамках исследования была собрана выборка твитов: всего было загружено 12123 твита, содержащих 29 текстовых интернет-мемов. После предобработки в среде RStudio выборка сократилась до 4973 твитов. Предобработка включала в себя удаление из выборки слишком коротких твитов. 100 случайно отобранных твитов были размечены четырьмя аннотаторами (включая автора исследования), но согласованность их ответов оказалось низкой. 1000 твитов, исследующихся далее, также были случайно выбраны из предобработанной выборки, но размечены уже самой докладчицей.

Ася предположила, что с ироничностью твита могут коррелировать следующие три признака:

1) тональность контекста мема;

2) наличие крайне отрицательных и крайне положительных слов в твите;

3) наличие крайне отрицательных слов в контексте мема.

Только последние два из признаков имеют значимую корреляцию с ироничностью твита. Наличие в контексте интернет-мема крайне негативно окрашенных слов связано с ироничностью твита. Присутствие таких лексем в контексте мема может являться признаком для обучения модели, автоматически распознающей иронию в твитах.

В конце доклада состоялась оживленная дискуссия, в ходе которой участники семинара обсудили субъективность определения иронии и генезис мемов. Была отмечена перспективность исследований, посвященных мемам.

Видеозапись встречи

Post Scriptum

Выражаем благодарность всем участникам семинара. Спасибо за интерес и оживленную дискуссию!

До скорой встречи!

Дата

12 июня 2022

Рубрики

Наука

Темы

профессора студенты репортаж о событии инновации

В статье упомянуты

Научно-учебная группа междисциплинарных филологических исследований Санкт-Петербургского кампуса НИУ ВШЭ