«Расшифровка века»: как почтовые открытки помогают ученым в лингвистических исследованиях
Что может рассказать исследователю старинная почтовая открытка? Как современные технологии помогают расшифровать послание, написанное почти век назад? В Питерской Вышке прошел научный семинар проекта «Пишу тебе», на котором участники искали ответы на эти вопросы.

Проект «Пишу тебе» бережно собирает, хранит и предоставляет исследователям доступ к многоязычной базе почтовых открыток из различных исторических периодов. В команду входят студенты, преподаватели и увлеченные историей сотрудники Вышки. В цифровую коллекцию входят более 80 тысяч открыток. Обновленную версию представили на семинаре в Питерской Вышке.
Стажер-исследователь Центра исторических исследований НИУ ВШЭ — Санкт-Петербург, студентка 4-го курса образовательной программы «История» Полина Пермякова пояснила, что материалы поступают из музейных фондов, частных коллекций и открытых источников. Как отмечает один из соавторов инициативы, заместитель декана факультета гуманитарных наук нижегородского кампуса НИУ ВШЭ Тимур Хусяинов, проект привлекает людей с разными компетенциями и интересами. «Каждая встреча с коллегами — это возможность поделиться своими наработками, познакомиться поближе и обсудить новые идеи», — добавил он.
Член научно-учебной группы «Динамика коммуникативных практик в почтовой переписке» Марина Мокина поделилась опытом, как студентам удалось настроить LLM (большая языковая модель) для расшифровки неразборчивого почерка и фрагментов текста. А ведущий специалист отдела организации учебного процесса и магистрант программы «Языковые технологии в бизнесе и образовании» Илья Шахов рассказал об эксперименте с генерацией изображений в стилистике почтовых открыток.
«Сейчас все изображения ИИ создаются именно таким образом: модель берет картинку и добавляет на нее «шум» до того момента, пока исходное изображение не превратится в набор пикселей, — объяснил Илья Шахов. — Но сама генерация происходит, когда модель воспроизводит обратный процесс — из набора пикселей собирается готовое изображение. Мы будем обучать наши модели таким же способом».
Заведующая Лабораторией языковой конвергенции Анастасия Колмогорова представила доклад о цифровом анализе почтовых открыток авторов из Петербурга, Петрограда и Ленинграда. Она исследовала, как со временем менялись подписи отправителей. По словам эксперта, «Пишу тебе» помогает и в глобальных лингвистических исследованиях, к примеру, о смысловых значениях единиц языка.
«В ходе работы я обнаружила, что у каждого времени есть свой антропонимический канон. Например, в советское время в текстах открыток мужчин называли по фамилии (вчера приходил Иванов…), а женщин — по имени и отчеству или по имени. Очевидно, что это влияние военного и послевоенного времени. В дореволюционных открытках заметна самая большая вариативность одного и того же имени, поскольку каждое имело множество ласковых и домашних вариантов. К сожалению, в наше время такая нежная вариативность практически исчезает», — отметила Анастасия Колмогорова.
Основатель Детского музея открытки Виталий Третьяков по итогам семинара предложил расширить сотрудничество с проектом. «Мы можем провести экспертную оценку сгенерированных картинок с привлечением филокартистов. На ежемесячных собраниях моего клуба объединяется примерно 20 человек. Уверен, это достаточное количество профессионалов для такого тестирования», — резюмировал партнер проекта «Пишу тебе».
Пермякова Полина Васильевна

