В чем сила слова: ученые и студенты ВШЭ будут исследовать поэтические тексты компьютерными методами
Профессор Евгений Вячеславович Казарцев, недавно возглавивший Школу филологических наук ВШЭ, рассказал новостной службе московского портала о проекте «Компьютерные методы исследования художественного текста». В нем примут участие студенты Вышки, а также руководитель ОП «Филология» петербургского кампуса Татьяна Юрьевна Шерстинова.
Первые в мире исследования структурных параметров художественного текста с помощью математики начались в нашей стране в 1920-е годы и были связаны с именем Андрея Белого – знаменитого поэта «Серебряного века». Затем это направление развивалось не только в СССР, но и в Европе, в США, где применительно к нему стали использовать понятие «русский лингво-статистический метод» или просто «русский метод» (термин американского исследователя Джеймса Бейли). В 1960-80-х годах группой знаменитого математика – академика Андрея Колмогорова проводились исследования ритмики стихотворного текста на основе вероятностных моделей.
Однако до сих пор большинство подсчетов осуществлялось вручную. И сейчас настало время их компьютеризации – проверки уже собранных данных, разработки единой методики разметки стиха и прозы на разных языках, создания нового программного обеспечения.Это позволит проводить сравнительные исследования, моделировать процессы порождения и восприятия стихотворных текстов на принципиально ином уровне.
Стоит отметить, что ученые ВШЭ при участии студентов приступили к этой работе еще до создания Школы филологических наук. В течение пяти последних лет на средства гранта Российского научного фонда в Санкт-Петербургском кампусе реализуется проект «Современные модели поэтики: реконструктивный подход», положивший начало созданию компьютерной системы анализа поэтических текстов. В этой системе, не имеющей аналогов в мире, с одной стороны, существует корпус текстов на разных языках, с другой стороны – достаточно простой, но в то же время небанальный математический аппарат анализа этих текстов.
Теперь же исследования будут проводиться в рамках Школы филологических наук, Школы лингвистики и Школы компьютерных наук с привлечением коллег из Санкт-Петербургского кампуса ВШЭ, других российских и зарубежных научных и образовательных центров (МГУ, СПбГУ, РГГУ, Физико-технического института имени А.Ф. Иоффе, Трирского университета, Чешской академии наук). К ученым присоединятся студенты. Будет сформирована постоянная международная исследовательская группа, а в перспективе планируется создать международный компьютерный центр по изучению художественного текста.
Евгений Казарцев, руководитель Школы филологических наук ВШЭ
Основная задача наших исследований – объяснить силу поэтического текста, проанализировать различные художественные эффекты с помощью точных методов. Мы ищем ответы на вопросы о том, как текст воздействует на человека, делаем попытку реконструкции глубинных процессов творчества великих поэтов: Шекспира, Гете, Пушкина, Блока и других.
Планируется реализовать несколько студенческих проектов по разработке и совершенствованию аналитического компьютерного корпуса стихотворных и прозаических текстов на разных языках. На средства гранта факультета гуманитарных наук группа профессора Константина Поливанова займется разработкой цифровых форм представления биографии Бориса Пастернака в широком культурном и историческом контексте. Под руководством доцента ВШЭ в Санкт-Петербурге Татьяны Шерстиновой будет создан корпус повседневной речи персонажей художественной прозы.
Студенты-филологи ВШЭ уже сейчас изучают ряд курсов по стиховедению, проводится научно-исследовательский семинар, посвященный изучению стиха и прозы с помощью квантитативных и компьютерных методов. Благодаря проекту «Компьютерные методы исследования художественного текста» данное направление в образовательных программах будет развиваться более интенсивно – в частности, запланирован новый научно-исследовательский семинар, в котором студенты всех кампусов смогут участвовать онлайн. Он будет посвящен применению современных компьютерных методик для обработки, атрибуции и анализа текстов.
В этом году начала работу научно-учебная группа «Когнитивная и лингвистическая поэтика», изучающая появление и развитие стихотворного метра у разных народов с применением корпусных данных и лингво-статистической обработки текстов. Исследование ведется на материале девяти языков: русского, английского, немецкого, нидерландского, шведского, польского, татарского, белорусского и украинского. Полученный материал дает возможность сформировать целостную картину развития родственных метрических систем в условиях разных традиций.
В рамках проекта запланирован ряд публикаций, посвященных компьютерным методам анализа стиха и прозы, в ведущих российских и международных изданиях. На лето 2021 года намечена международная научная конференция «Сравнительная и когнитивная метрика и ритмика» памяти профессора Марины Красноперовой – автора теории реконструктивного моделирования стихосложения, ученицы академика Колмогорова.
«Если наши планы удастся реализовать, в Высшей школе экономики будет создана авторитетная международная площадка в сфере изучения метрически организованных текстов», – считает Евгений Казарцев.