• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Обработка данных психолингвистических экспериментов

Как проходят практику студенты ОП “Языковые технологии в бизнесе и образовании”

Анастасия Ермакова занималась статистической обработкой и визуализацией данных психолингвистических экспериментов по недискретной разметке эмотивности текстов на русском языке русскими монолингвами и тувинско-русскими билингвами в Лаборатории прикладной лингвистики и когнитивных исследований Сибирского федерального университета. Анастасия делится опытом и рассказывает, над какими задачами она работала во время практики:

  • У нас была двухнедельная учебно-ознакомительная практика, мы сами выбирали задачи, которыми будем заниматься, из предоставленного пула. Я выбрала задание по статистическому анализу. У меня были результаты эксперимента по эмоциональному аннотированию постов из VK, и мне нужно было оценить статистические различия в распределении двух выборок. Это были выборка эмоциональных оценок текстов от русских монолингвов, с одной стороны, и выборка оценок от тувинско-русских билингвов, с другой стороны. Нужно было сделать визуализации этих распределений оценок, чтобы наглядно представить сдвиги для двух групп информантов, чтобы можно было комфортно сравнивать результаты.

Тексты постов в VK разделили на группы по доминирующей эмоции и сделали специальный интерфейс со шкалами для оценивания присутствия этих эмоций. Далее для разметки этих текстов было собрано две группы информантов: русские монолингвы и тувинско-русские билингвы. Они оценивали тексты по этим шкалам.

Мои данные выглядели как огромные таблички с какими-то цифрами, это и были эмоциональные оценки по шкалам. Надо было посмотреть как различаются распределения этих оценок для билингвов и монолингвов, в какую сторону может быть сдвиг, если он есть. До меня были проведены первые эксперименты, и было понятно, что сдвиги есть, но нужно было показать на визуализациях, в какую сторону происходят сдвиги, в сторону каких эмоций.

Мне предстояло сделать визуализацию полученных данных, конечно, написать отчет о проделанной работе. Также в конце практики мы делали презентации результатов практики, и это было классно, потому что я посмотрела, что делали другие студенты, какими инструментами они пользовались и какие задачи удалось решить.

Сравнение распределений оценок по шкалам у билингвов и монолингвов для текстов с общей размеченной эмоцией. Ящичные диаграммы.
Доверительные интервалы для средних оценок по шкалам оценки для трёх групп билингвов.
Ящичные диаграммы.

Несмотря на то, что практика была удаленной, мы всегда были на связи с руководителем. Сперва я подумала, что за две недели я не успею почувствовать “дух практики”, когда я оказываюсь лицом к лицу с техническим заданием. Но сейчас я даже рада, что первая практика оказалась такой небольшой, потому что была возможность после практики отрефлексировать свое поведение, понять, насколько хорошо я могу самоорганизоваться и применить полученные знания, оказываясь наедине с заданием. На бакалавриате у меня не было подобной прикладной практики. Одно дело это выполнять какие-то задания в учебе, а тут реальные данные и реальные жизненные задачи.