• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Машинное обучение и анализ данных»: кого готовит программа и что на ней изучают

В 2020 году магистратура «Промышленное программирование» меняет свое название на «Машинное обучение и анализ данных». Редакция вместе с деканом Санкт-Петербургской школы физико-математических и компьютерных наук Александром Владимировичем Омельченко рассказывают, что будут изучать студенты на обновленной программе и чем перспективно машинное обучение.

«Машинное обучение и анализ данных»: кого готовит программа и что на ней изучают

iStock

Узнать подробнее о количестве мест и вступительных испытаниях можно на странице программы. Информация о поступлении находится в разделе для абитуриентов магистратуры.

В чем различие магистерских программ «Машинное обучение и анализ данных» и «Программирование и анализ данных»?

На факультете Санкт-Петербургская школа физико-математических и компьютерных наук есть магистратура «Программирование и анализ данных». На этой программе ждут выпускников бакалавриата с углубленным изучением программирования и математики, такого как в Питерской Вышке. Это научная магистратура, куда приходят люди с достаточно высокой степенью подготовки и в области программирования, и в области машинного обучения и анализа данных. Они хотят еще больше прокачать свои навыки для работы в компаниях или подготовиться к аспирантуре.

В отличие от этой магистратуры программа «Машинное обучение и анализ данных» направлена на абитуриентов, у которых нет глубоких знаний в области математики и информатики. Возможно, они закончили бакалавриат не по направлению компьютерных наук или не получили достаточно сильной подготовки по своей специальности в другом университете. Обновленная программа предлагает им за два года освоить область машинного обучения и анализа данных.

Что должен знать и уметь абитуриент?

Поступить в магистратуру с нулевыми знаниями программирования и высшей математики не получится. «Машинное обучение и анализ данных» предполагает, что у абитуриента есть минимальный уровень подготовки. Руководство программы рекомендует пройти несколько онлайн-курсов перед поступлением чтобы изучить или повторить, например, основы дискретной математики и языка Python.

Однако знания — не единственный критерий отбора абитуриентов.

Декан Санкт-Петербургской школы физико-математических и компьютерных наук, Александр Владимирович Омельченко:

«За два года студенты программы проходят интенсивный курс в области машинного обучения и анализа данных. При этом магистратура не требует от абитуриента высокого уровня подготовки. Нужно лишь базовое понимание математики и информатики.

Нам [руководству программы] важно, чтобы поступающий был замотивирован и понимал, с чем ему предстоит столкнуться на программе. У нас большое количество пар, и они, в основном, дневные. Магистранту придется интенсивно работать и многое изучать самостоятельно. На собеседовании мы хотим понять, готов ли он к этому».

Чем перспективны направления машинного обучения и анализа данных?

Одна из задач современной IT-области — создать искусственный интеллект, то есть научить компьютер решать нетривиальные задачи так, как это делает человек. Машинное обучение — часть этой задачи. Например, чтобы научить автомобиль ездить самостоятельно, нужны методы машинного обучения. Необходимо объяснить программе на ее языке, как и что она должна делать. Специалисты из этой области изучают, какими методами лучше всего совершать эти операции и придумывают новые способы обучения.

Машинное обучение также помогает в анализе данных. Во многих областях человеческой деятельности, существует непрерывный поток информации. Это большие объемы данных, которые человек не может обработать физически. С этим справляются машины. Они помогают в логистике, продажах, работе с социальными сетями, в биоинформатике и так далее. Компаниям, например, банкам, нужны специалисты, которые умеют обращаться с машинами, обрабатывать и анализировать данные с их помощью. Они также востребованы за рубежом.

Как происходит обучение на программе?

На первом году обучения во время осеннего модуля магистранты проходят курсы по алгебре, теории вероятности и математической статистике. Это сделано для того, чтобы повторить материал, который студенты учили в бакалавриате или осваивали самостоятельно. Затем они проходят базовые курсы по машинному обучению, такие как «Основы алгоритмов» и «Методы оптимизации».

На втором году программы начинаются специализированные курсы. Например, студенты учатся работать с алгоритмами и программным обеспечением для обучения беспилотных автомобилей. Они также изучают «Анализ данных на Python в примерах и задачах», проходят курс по «Нейробайесовским методам», чтобы создавать генеративные модели. В результате за 2 года магистранты постепенно осваивают область машинного обучения и анализа данных — от азов до последних достижений в науке.

Как устроена научная и проектная деятельность в магистратуре?

На программе студенты занимаются обязательной проектной деятельностью. Она начинается в весеннем семестре первого года обучения. Проекты предлагают партнерские компании и исследовательские лаборатории, а также преподаватели НИУ ВШЭ — Санкт-Петербург.

Некоторые компании и лаборатории делают тестовые задания для желающих. Магистранту нужно выполнить их, чтобы попасть в команду. Студент может выбрать несколько проектов, пройти все входные тесты, а затем решить, чем именно хочет заниматься. По итогам семестра, нужно презентовать результаты своей работы.

Часто на проектах студенты решают прикладные задачи, с которыми на программу обращаются компании. Например, компания JetBrains приглашала студентов на проект по работе с плагином для улучшения поддержки естественного языка в среде разработки программного обеспечения IntelliJ IDEA. Этот плагин основан на методах машинного обучения и информационного поиска.

Кроме того, JetBrains тесно сотрудничает с программой «Машинное обучение и анализ данных», часть сотрудников компании преподают некоторые дисциплины магистратуры

Студенты магистратуры защищают свои первые исследовательские или прикладные проекты в конце первого года обучения. Затем на втором году обучения они выполняют еще два проекта: осенью и весной. Это могут быть два разных проекта или один, который студент развивает после осенней защиты и представляет как часть магистерской диссертации. Весной на втором курсе почти все занятия на программе заканчиваются и магистранты могут сосредоточиться на своем научном исследовании.

Летом между первым и вторым курсом студенты могут съездить в летние школы или пройти стажировки в партнерских компаниях программы, например, «Яндекс», JetBrains и «Ростелеком».

В каких лабораториях и центрах можно работать над проектами?

Проектной деятельностью можно заниматься и в Центре анализа данных и машинного обучения НИУ ВШЭ — Санкт-Петербург. Питерская Вышка создала этот центр в сотрудничестве с исследовательским подразделением JetBrains. Заведует центром Алексей Александрович Шпильман — преподаватель в Питерской Вышке и сотрудник JetBrains. Он также руководит несколькими лабораториями компании, которые сотрудничают с центром: «Прикладное машинное обучение и глубинное обучение» и «Агентные системы и обучение с подкреплением». Студенты Питерской Вышки могут проходить стажировки и выполнять проекты в этих лабораториях.

В 2019 году команда центра выиграла соревнования на Международной конференции робототехники ICRA 2019 в Монреале. Почитать подробнее о соревнованиях и работе команды можно в интервью со студентом программы «Машинное обучение и анализ данных» Никитой Сазановичем.

Чем могут заниматься выпускники программы?

Специалист может заниматься машинным обучением по заказу. К примеру, медицинская компания просит обучить компьютер, чтобы он определял по рентгеновским снимкам заболевания на ранних стадиях. Машина сделает это точнее, чем человек. В случае с такой задачей, специалист не разрабатывает новые методы обучения, а использует уже существующие. Ему нужно понять, какие из них лучше использовать для решения задачи и адаптировать под заказчика. Подобные задачи могут поступать из разных областей — от финансовой до военной. Специалист должен знать методы оптимизации, исследования операций, математическую статистику и другие направления прикладной математики, которые составляют базу машинного обучения.

Второй вариант деятельности более научный — это работа не над прикладными задачами, а с самими методами машинного обучения. Специалист может изучать методы, заниматься улучшением или созданием алгоритмов обучения. В этом случае, ему нужны очень глубокие знания математики.

Какие вступительные испытания ждут абитуриентов?

Декан Санкт-Петербургской школы физико-математических и компьютерных наук 

Александр Владимирович Омельченко:

«Вступительные экзамены состоят из двух частей. Первая — письменный экзамен. На нем студенту нужно решить некоторые несложные задачки по математике — теории вероятности, линейной алгебре и так далее. В экзамене также есть задания на проверку базовых навыков программирования.

Вторая часть — собеседование. С каждым абитуриентом мы [приемная комиссия] общаемся в среднем по полчаса. На собеседовании мы пытаемся понять, насколько человек замотивирован учиться, какие у него были проекты, чем он хочет заниматься на программе. Это возможность «вытащить» из абитуриента все его лучшие стороны и разобраться, в чем он силен. Абитуриент также может задать свои вопросы о программе. Мы отвечаем и рассказываем, как устроено обучение.

Человек должен понимать, что программа очень трудозатратная, у него вряд ли получится совмещать учебу и работу. Этот момент мы стараемся компенсировать стипендиями от JetBrains. Абитуриента ждут два трудных, но интересных года. По окончании программы он сможет претендовать на высокие зарплаты от 100 тыс руб.».