"Программа обеспечивает хорошие условия для освоения абитуриентов как с гуманитарных, так и с технических специальностей". Ярослав Барыкин о своём первом годе обучения на АДГО
Ярослав Барыкин – выпускник бакалаврской программы «Политология и мировая политика» 2023 года. В прошлом году Ярослав был единственным студентом, кто сдал государственный экзамен на высший балл. Выпускник уже рассказывал о своем опыте обучения в Вышке, личных достижениях и пути к красному диплому. Сейчас Ярослав учится на 1 курсе магистратуры «Анализ данных для государства и общества». Мы поговорили с Ярославом о том, как он выбирал магистратуру, как осуществляется учебный процесс и какими лайфхаками стоит воспользоваться абитуриентам при поступлении.
Ярослав, в прошлом году вы закончили бакалавриат политологии Питерской Вышки. Сейчас вы учитесь на Анализе данных для государства и общества. Почему выбор пал именно на эту магистерскую программу?
Идея поступить на программу, подобную этой, зародилась у меня еще на втором курсе бакалавриата, когда мною осваивались “Количественные метода анализа” и майнор “Data Science”. Я получил наглядное представление о том, как можно применять аналитику данных в социальных науках, и загорелся идеей совмещения технического и гуманитарного направления. С этого момента большинство моих академических проектов, в том числе дипломная работа, развивались в этом направлении. Когда я в конце третьего курса рассматривал варианты магистратуры и узнал о новейшей программе “Анализ данных для государства и общества”, у меня осталось мало вопросов по поводу дальнейшей траектории. Это программа совмещает социальные науки с наукой о данных, и на ней работаю знакомые мне преподаватели, которые зарекомендовали себя как ответственные и квалифицированные наставники.
Есть ли лайфхаки к поступлению на АДГО, которыми вы бы хотели поделиться с абитуриентами?
Не то чтобы лайфхаки, но определенного рода рекомендации есть. Основное внимание следует уделить некоторым аспектам исследовательского проекта, который в рамках портфолио оценивается в самое большое количество баллов. От абитуриентов не требуется расписать подробнейший план исследования. Но стоит задуматься, с какой социальной проблематикой вам хотелось бы разобраться и насколько она актуальна, ведь скорее всего вы свяжете с этим свою магистерскую работу. В проектном предложении следует четко обозначить исследовательский вопрос, его значимость, сослаться на уже существующие работы по данной или схожей тематике.
Другим значимым элементом проекта, на который приемная комиссия обращает пристальное внимание – демонстрацию понимания пайплайна работы с большими объемами информации. От абитуриента требуется показать знание того, какие данные он использует, какими характеристиками эти данные обладают, где и как их можно достать, какими методами можно проанализировать. Для этого не обязательно требуется бэкграунд в области количественных методов анализа. Нужно лишь ответственно подойти к оценке структуры данных и самостоятельно изучить основные способы анализа – они, кстати, перечисляются среди курсов образовательной программы.
Конечно, также важно привести релевантный опыт, если такой имеется. Сюда относятся опыт работы, стажировки, участие в исследовательских конкурсах и проектах, прохождение курсов, связанных с аналитикой данных. Еще одним бонусом являются сертификаты по владению английским языком – IELTS, TOFU, CAE.
Трудно ли учиться тем, у кого нет опыта в анализе данных? С каким бэкграундом лучше всего идти на АДГО?
У нас на курсе есть несколько ребят, которые ранее не работали в этой области или мало затрагивали анализ данных. Специально для них существует несколько предметов, которые обучают основам программирования в Python и R, знакомят с основным инструментарием в области количественных методов анализа. Аналогично, для людей с чисто техническим бэкграундом есть вводные курсы по основам политологии и социологии. Поэтому АДГО обеспечивает хорошие условия для освоения абитуриентов как с гуманитарных, так и с технических специальностей. В первом случае необходимо вникнуть в технические особенности преподаваемых методов, причем необязательно с точки зрения хардкорной математики. Во втором случае предстоит понять особенности социально-ориентированного исследовательского процесса. Конечно, для тех, кто уже опробовал себя в обоих направлениях, это будет даваться весьма легче.
Расскажите об учебе в магистратуре. Чем вы занимаетесь на 1 курсе, какое исследование готовите, какие предметы вам нравятся?
Я бы охарактеризовал учебный курс первого года обучения как возможность опробовать ряд инструментов количественного анализа. К нему относятся разные регрессионные модели, методы обработки естественного языка (NLP), агентное моделирование, немного машинного обучения. Уделяется внимание способам сбора данных из социальных сетей и других веб-ресурсов. Пожалуй, из данного набора наиболее любимыми стали “Введение в NLP” и “Многоуровневое моделирование”, выборный курс по конкретному случаю применений регрессионного анализа.
Хочется отметить вариативность работы в рамках данных предметов. Каждый преподаватель предлагает студентам самостоятельное проведение проекта в области своего курса. Поэтому у учащихся есть свобода выбора как темы проекта, так и конкретных данных и инструментов в пределах осваемого курса. В этом плане, мне очень понравилось работать с Telegram-каналами российских губернаторов, выявлять упоминающиеся в них темы и визуализировать группы регионов с общей тематикой.
Для курсовой работы, я выбрал тему зависимости электорального успеха европейских популистских партий от дизайна демократических институтов. Если вкратце, то есть идея проверить на выборке из 70 популистских партий в Европе; негативно ли влияют такие аспекты политического устройства, как федерализм, парламентаризм и правительственные квоты для этнических меньшинств. Уже собрал много данных из разных источников по этой теме, и сейчас вместе с научным руководителем ведутся активные обсуждения того, каким методом это лучше всего проанализировать.
Ярослав, есть ли у вас проекты, которыми вы занимаетесь помимо учебы? Возможно работаете?
В рамках проектной деятельности я участвую в проекте Счетной палаты по оценке открытости органов государственной власти РФ. Моя роль заключается в оценке качества и доступности открытых данных, предоставляемых государственными ведомствами.
Я также прохожу испытательный срок в Центре политической конъюнктуры. В обязанности входит количественный анализ информационного поля, написание аналитических отчетов. ЦПК также организует ряд исследовательских проектов, использующих анализ данных, где как раз востребованы навыки, полученные в рамках АДГО.
Напоследок, поделитесь планами на конец этого учебного года.
За первый год обучения накопилось множество материалов, предполагающих углубленное изучение уже знакомых инструментов анализа данных. Их необходимо изучать, чтобы определиться с желаемой спецификой в аналитике. На данной момент для меня такими направлениями являются текстовый анализ с помощью моделей эмбеддингов и нейронных сетей, а также многоуровневое моделирование.
Также хочется применить данные знания на практике, поэтому постоянно отслеживаю проекты лабораторий ВШЭ на соответствующие темы на “Ярмарке проектов”.
Беседовала Вероника Бердникова