• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Полина Максименко – филолог, советующий всем учить математику

Полина Максименко
студентка 3 курса, ОП Филология

PR-команда Центра развития карьеры, в лице Ангелины Ягудиной, взяли интервью у студентки 3 курса ОП «Филология», которая поделилась опытом и рассказала про свой путь в Вышке.

Привет! Представься, пожалуйста, как тебя зовут, на какой ОП и на каком курсе ты обучаешься.

Полина: Добрый день! Меня зовут Полина Максименко. Я учусь на третьем курсе, ОП «Филология».

Почему ты выбрала образовательную программу «Филология» в Питерской Вышке? Что тебя привлекло в ней?

Полина: Дело в том, что при поступлении я рассматривала программы по лингвистике, по компьютерной лингвистике в частности. В «Филологии» в Питерской Вышке меня привлекло именно то, что здесь совмещается литературоведение и лингвистика, очень много возможностей выбора предметов для построения своей индивидуальной образовательной программы. Мне понравилось, что здесь есть те предметы, которые были мне интересны именно в момент поступления такие как теоретическая и компьютерная лингвистика и цифровые методы в гуманитарных науках.

Мы знаем, что ты занимаешься наукой. Расскажи, пожалуйста, о своей сфере научной деятельности: чем ты занимаешься и что тебе интересно в науке?

Полина: В науке я занимаюсь как раз-таки компьютерной лингвистикой и всем, что находится на стыке языка, литературы и компьютерных методов. На данный момент я пишу курсовую работу на материале фанфикшена. Меня всегда интересовало это направление, я сама являюсь поклонником и в прошлом создателем фанфикшена. Поэтому мне показалось очень интересным собрать базу фан-текстов и проанализировать их с помощью разных компьютерных методов. В рамках научно-учебной группы по методам искусственного интеллекта в филологии под руководством Татьяны Юрьевны Шерстиновой я вместе с другими студентами в последнее время занимаюсь сентимент-анализом, то есть анализом эмоций в тексте. Он проводится с помощью компьютерных моделей, основанных на разных методах. На данный момент мы анализируем эмоциональную составляющую литературных текстов из Корпуса русского рассказа начала XX века. Мы сопоставляем то, как студенты нашего филфака, во время практики разметили эмоции в рассказах и то, как тональность этих текстов определили разные модели.

Ты сказала то, что на вашей программе уже есть предметы, которые связаны с текстовыми данными, также ты обучаешься на майноре, который связан с машинным обучением. Можешь, пожалуйста, рассказать, почему ты выбрала этот майнор и насколько те знания, которые ты получаешь там помогают тебе в научной деятельности?

Полина: Да, мой майнор - «Интеллектуальный анализ данных». Там мы в основном занимаемся машинным обучением. Сейчас мы разбираем глубинное обучение, то есть всё, что связано с нейросетями. Рассматриваем какие-то конкретные случаи, примеры применения нейросетей в разных областях, в том числе в науке и в NLP (Natural Language Processing) компьютерной обработке естественного языка. На майноре этому был посвящен блок из нескольких лекций и семинаров, что для меня было очень полезно и интересно. Например, мы разбирали, как написать код для машинного переводчика, вопросно-ответной системы и других моделей, которые работают с языком. Пока у меня не так много опыта в этой сфере, и я совершенствуюсь, несмотря на то, что мне не хватает математического бэкграунда. Поэтому сейчас я работаю над этим, чтобы в будущем применять свои знания и навыки глубинного обучения в научной деятельности. 

Можешь, пожалуйста, рассказать, когда у тебя появился интерес к изучению текста через методы машинного обучения?

Полина: Скорее всего, с началом учебы в Вышке. Когда я поступала, я понимала, что мне в целом интересно узнать, как можно совместить компьютерные методы и изучение языка. Тем не менее у меня не было никакого опыта в этой сфере, я только слышала о том, что это очень перспективное, набирающее популярность направление. На втором курсе у нас были предметы по количественным методам анализа текста и корпусной лингвистике, где мы использовали компьютерные методы. Мне кажется, именно тогда я поняла, насколько это мне нравится и насколько мне хочется заниматься этим в дальнейшем.

Можешь, пожалуйста, поделиться тем, какие программы/инструменты ты используешь в своей научной деятельности?

Полина: Во время применения сентимент-анализа мы используем разные программы, электронные словари. Я, к примеру, работала с Python-библиотекой Dostoevsky. Это - модель, которая обучена на русскоязычных текстах из социальных сетей. Я уже работаю непосредственно с Python, пишу на этом языке код, который обрабатывает текст. Конкретные программы, приложения и модели подбираются для каждой научной задачи отдельно. Часто я пользуюсь разработками других ученых, адаптирую код на Python, который есть в открытом доступе, под те тексты, которые нужно обработать. 

Ты училась программировать на Python на майноре и на предметах, которые есть на твоей образовательной программе? Или ты брала какие-то дополнительные курсы, чтобы обучиться программированию?

Полина: Вообще я начала знакомиться с Python на майноре в первом семестре второго курса, когда у нас был вводный курс, но мне его не хватило. Некоторые моменты показались мне довольно сложными, поэтому потом я проходила бесплатные курсы на разных онлайн-платформах, чтобы подтянуть свои знания. Когда у нас на «Филологии» уже в конце второго курса был обязательный предмет по основам Python, мне не составило труда сделать все задания, потому что у меня уже был наработан этот навык.

Ты сказала, что у тебя иногда бывают сложности с пониманием математики. Когда ты сталкиваешься с такими трудностями, как ты с ними справляешься эмоционально?

Полина: Это довольно тяжело переживать: часто у меня на майноре возникали такие ситуации, когда во время занятий студенты, которые обучаются со мной, понимают всё, что происходит, а я нет, так как у меня нет никакого бэкграунда в высшей математике, статистике. У нас на филфаке не было никаких полностью математических предметов. Это очень демотивирует, когда ты сталкиваешься с такими трудностями и приходится, конечно, потом самостоятельно разбирать какие-то материалы, то есть что-то отдельно смотреть читать и находить в Интернете, иначе получается, что в ходе семинара я не могу задать вопросы по математической части, потому что подразумевается, что я уже должна это знать.

Теперь я бы хотела тебя спросить про лабораторию. Расскажи о ней поподробнее, как она называется, чем вы там планируете заниматься?

Полина: Наша лаборатория называется «Лаборатория языковой конвергенции». И конкретно тема исследований – это текст, как Big Data, то есть большие данные, или моделирование конвергентных процессов в языке и речи цифровыми методами. Опять же мы здесь сталкиваемся с обработкой языка с помощью цифровых методов. Если обобщить мы занимаемся анализом баз текстовых данных с применением цифровых методов и выявляем лингвистические характеристики текстов. В качестве одного из направлений, мы продолжим заниматься сбором Корпуса русского рассказа XX века. Когда мы составим эту базу текстов, ее также можно будет проанализировать и сделать на основе компьютерной обработки какие-то выводы о структуре этих текстов, об их особенностях. 

И ты являешься непосредственно сотрудником этой лаборатории?

Полина: Да, недавно завершился процесс приема сотрудников, и я официально стала стажером-исследователем нашей лаборатории.

Можешь рассказать, как ты попала на эту должность и почему она тебя привлекла?

Полина: Изначально была научно-учебная группа под руководством Татьяны Юрьевны Шерстиновой, где студенты и преподаватели вместе занимались компьютерным анализом литературных текстов. Когда я была на втором курсе и у меня появился интерес к этой сфере, Татьяна Юрьевна вела у нас предмет, связанный с применением цифровых методов в литературоведении. Она заметила, что мне это интересно и что у меня это хорошо получается и в результате пригласила меня в научно-учебную группу. В прошлом году в декабре мы завершили этот этап, и наши руководители, Татьяна Юрьевна и ученые из Московской Вышки решили объединиться и подать заявку на лабораторию. Несмотря на то, что я сомневалась, буду ли я успевать совмещать учебу и более глубокое погружение в науку, я всё-таки сделала выбор в пользу работы в лаборатории, потому что научная деятельность и стаж очень важны для моего портфолио и для поступления в магистратуру. И конечно, я хочу развиваться в сфере компьютерной лингвистики и надеюсь, что опыт и навыки, которые я получу в лаборатории пригодятся в дальнейшем в моей карьере.

Ты хочешь пойти на магистратуру, которая также будет связана с филологией?

Полина: Я хочу пойти в магистратуру «Языковые технологии в образовании в бизнесе» у нас в Питерской Вышке. Эта программа открылась два года назад, а я этого очень ждала, потому что уже с первого курса думала, как я продолжу свой образовательный путь. Мне кажется, что эта магистерская программа идеальна для меня, потому что там обучают именно тому, чем я хочу продолжать заниматься.

Много ли времени уходит у тебя на научную деятельность?

Полина: Это, конечно, бывает по-разному, потому что большую часть моего времени занимает учеба. Но если, допустим, у меня есть какая-то новая научная задача, которую нужно реализовать в кратчайшие сроки, например, если мы пишем статью, тогда на научную деятельность уходит действительно много времени. Но вообще я стараюсь отделять науку от учебы и распределять свое время так, чтобы все не свалилось в последний момент.

Если происходит такая ситуация, что все сваливается в один момент и ты очень сильно устаешь, как ты обычно восстанавливаешь силы? Может, у тебя есть какое-то хобби или занятие, которое восстанавливает тебя и приносит удовольствие?

Полина: Я бы не сказала, что у меня есть какое-то определенное хобби. Хотя мне бы очень хотелось его иметь, потому что я большую часть своей жизни занималась музыкой, и жалею, что с учебой в университете это ушло из моей жизни. Я очень люблю прогулки, например, поехать куда-нибудь в парк, отключить телефон и просто несколько часов бродить, наслаждаться зеленью. Если вообще нет сил ничего делать, то я остаюсь дома и просто смотрю сериалы, шоу или играю в компьютерные игры, которые приносят мне положительные эмоции, и провожу время со своим молодым человеком.

Можешь, пожалуйста, дать совет студентам, которые начинают свой путь или хотят развиваться в сфере анализа текстов при помощи методов машинного обучения?

Полина Максименко

Я бы в первую очередь посоветовала учить математику, потому что часто бывает так, что в эту сферу приходят филологи и лингвисты без знания высшей математики и всего что выходит за рамки школьного уровня, а это оказывается очень важным. В какие-то моменты ты просто не можешь выполнить задачу, потому что у тебя не хватает знаний. Кроме того, я думаю, что для развития очень полезно попасть в научное сообщество, то есть уже с первого, со второго курса не бояться обратиться к преподавателю, который занимается исследованиями в интересующей тебя сфере, или спросить у студентов старших курсов, если они занимаются наукой. Мне кажется, что быть в сообществе, где тебя окружают люди, которые больше знают, разбираются в этой сфере - это очень важно, потому что именно так ты можешь почерпнуть необходимые навыки и знания.


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.