«Некоторые вещи можно понять только на практике, не боясь что-нибудь сломать», — Александр Климов о курсах, исследовательских интересах и преподавании
Как стажировка привела в Петербург, что значит по-настоящему «изучить язык» и почему студенту важно многое исследовать самостоятельно. Об этом и многом другом поговорили с Александром Климовым, преподавателем Департамента филологии и программы «Языковые технологии в бизнесе и образовании».
Вы оканчивали магистратуру московской Вышки в области компьютерной лингвистики, но что привело вас в Петербург?
По окончании магистратуры я год стажировался в университете Хельсинки. После стажировки профессор Хельсинкского университета Михаил Вячеславович Копотев пригласил меня на работу в ВШЭ в Петербурге. В 2019-2020 он занимался запуском магистерской программы «Языковые технологии в бизнесе и образовании». Я, собственно, ради этой магистратуры и переехал в Петербург, а не обратно в Москву, и до сих пор преподаю те курсы, которые изначально и планировались — «Введение в лингвистику» и «Основы баз данных».
Расскажите о курсах, которые вы преподаете. Как строятся занятия, чего вы ждете от магистрантов и каким образом удается вовлекать их в образовательный процесс?
Курс «Введение в лингвистику» не пользуется особой популярностью у студентов, потому что большинство наших магистрантов уже получали языковое образование в том или ином виде, а задача курса как раз дать самые основы языкознания — немного истории, когнитивной лингвистики, синтаксиса и так далее. Входного порога, на самом деле, нет. Важна готовность достаточно много и быстро учиться, писать эссе и изучить один язык по своему выбору во всех его аспектах, не зазубривая правила и тысячи слов. Необходимо именно изучить язык лингвистически, уметь его описать как работающую систему с точки зрения синтаксиса, морфологии, фонетики. Например, в завершившемся учебном году все официальные слушатели этого курса были айтишниками. Особенно приятно было, что на курс записалось несколько человек с других потоков, связанных с этой индустрией. Мне кажется важным понимание материала, с которым ты работаешь. В век генеративных моделей соблазн закинуть какие-то случайные языковые параметры в модель очень велик. Но, думаю, иногда полезно понимать, что именно ты используешь, чем отличается русский от английского и почему языковая модель может работать определенным образом.
Далеко не вчера лингвисты поняли, что создание больших языковых баз данных — одна из их ключевых задач. В каком-то смысле это нечто вроде святой миссии — сохранить, систематизировать, дать доступ. Возможно, звучит дерзко, но мне кажется, что «Основы баз данных» — один из основополагающих курсов нашей магистратуры. В глубине каждого ресурса в интернете находится база данных, в которой хранится все. Если спускаться с небес на землю, то многие из наших выпускников пойдут работать дата-аналитиками в различные компании: от образования до финтеха, — а владение базами данных, по крайней мере на уровне пользователя, является одним из ключевых требований работодателей. Важно уметь написать запрос к базе данных и получить весь искомый материал для дальнейшей аналитики быстро и эффективно. Помимо этого, довольно трудно сделать свое приложение, сайт, иногда и чат-бота без работающей «под капотом» базы данных. Многие магистранты уже с этим столкнулись. Хотите построить рекомендательную систему? Тогда вам точно понадобится где-то хранить ваш материал и как-то к нему обращаться. В этом случае уметь работать с базами данных и знать системы управления ими просто необходимо.
Этот курс в каком-то смысле достаточно прост для новичков: он не требует изначального владения какими-либо языками программирования. В ходе занятий мы с нуля изучаем языки запросов для разных СУБД, разбираемся с их готовыми графическими интерфейсами. Это заметно проще, чем работа с теми же Python или R, которые студенты изучают еще до нашего курса. Языки запросов имеют намного более узкий функционал, поэтому куда более приятный порог вхождения. К середине курса «Основы баз данных» мы учимся писать простенький интерфейс для обращения к серверу на языке Python. Если у кого-то из студентов возникают с этим сложности, то можно решить эту задачу, пользуясь уже готовыми графическими интерфейсами, без углубления в Python. Но, к сожалению, максимальную оценку в этом случае уже не получить.
Надеюсь, что мне действительно удается увлечь студентов своим предметом. Не уверен, что у меня есть какие-то особые методы преподавания: обычно мы обсуждаем материал, я задаю вопросы для размышлений в ходе лекций, дальше мы прорешиваем совместно или индивидуально разные задачки на составление запросов. В целом, как и все курсы программирования, «Основы баз данных» требует большого количества самостоятельной работы, взаимодействия с кодом, который был написан на занятиях, повторения, осмысления. Некоторые вещи иногда невозможно объяснить, можно только понять на практике, пробуя все руками, не боясь что-нибудь сломать.
Как формировались ваши исследовательские интересы и над какими темами вы работаете сейчас?
Когда я только начинал работу, в основном исследовал темы, на которые писал еще в магистратуре под руководством замечательных Михаила Копотева и Олеси Киселев. В основном эти темы были связаны с автоматическим предсказанием уровня владения русским как иностранным и статистическим изучением студенческого (учебного) текста как такового. Работа в питерской Вышке как раз помогла найти собственные интересы: сейчас я занимаюсь исследованиями в области Digital Humanities, цифровой гуманитаристики, в частности изучаю область цифрового литературоведения (Digital Literary Studies). Например, из последнего и еще неопубликованного — стилехронометрическое исследование стихотворений и песен Александра Башлачева. Если кратко, то это компьютерное, статистическое исследование достаточно крупных коллекций текстов. Я использую методы компьютерной стилистики, ставящее эти тексты в определенный временной контекст. Чувствую, что это моя область, так как мое первое образование — филолог-германист с упором на лингвистику, но с большим интересом к литературоведению и истории литературы. Сейчас я уже отчетливо понимаю, что мне хочется работать именно с художественным материалом, но используя точные методы.
Помимо прочего, вы осуществляете научное руководство. Расскажите, с какими темами вам хотелось бы поработать? Чего ждете от магистранта, с которым пишете исследование?
Мне интересно все, связанное со статистическими исследованиями тех или иных вопросов языкознания или литературоведения. Мне будет тяжело работать со студентами, которые хотят, например, исследовать нейронные сети, потому что это не входит в круг моих задач. Но история языка на большом массиве данных? Контрастное изучение эмоций в русском и французском сентиментальном романах? Это всегда интересно. От магистранта я бы ждал регулярной работы, готовности созваниваться хотя бы раз в месяц, нарабатывать и читать библиографию, ну и, конечно, всегда хочется некоторой самостоятельности, чтобы исследование было действительно совместным творчеством, новеллой, а не просто переработкой других текстов, созданных ранее.
Что бы вы порекомендовали будущим магистрантам и нынешним студентам?
Мне кажется, нужно следить за всем, что сейчас выходит в русскоязычном мире Digital Humanities. Системный Блокъ, телеграм-каналы DHcloud и Гуманитарии в цифре от СФУ — это минимум, который поможет следить за новостями и проектами в области цифровых гуманитарных наук. Ну и, конечно, не пропускайте мероприятия в Вышке. Например, регулярно проходят семинары Лаборатории языковой конвергенции, где всегда можно услышать много интересного и нового, найти себе тему по душе, с которой можно будет работать дальше в магистратуре.