«Машинное обучение и анализ данных»: кого готовит программа и что на ней изучают
Магистерская программа «Машинное обучение и анализ данных» подойдет тем, кто обладает базовыми знаниями по математике и информатике, но хочет разобраться в машинном обучении. Редакция рассказывает, что будут изучать студенты программы и чем перспективна учеба на ней.
В 2023 году программа «Машинное обучение и анализ данных» ведет набор студентов на 15 бюджетных и 15 платных мест, а также на одно платное место для иностранцев. Подробнее о программе можно узнать на специальной странице. Информация о стоимости обучения находится в разделе для абитуриентов магистратуры.
В чем особенности программы программ «Машинное обучение и анализ данных»?
На программа «Машинное обучение и анализ данных» направлена на абитуриентов, у которых нет глубоких знаний в области математики и информатики. Возможно, они закончили бакалавриат не по направлению компьютерных наук или не получили достаточно сильной подготовки по своей специальности в другом университете. Обновленная программа предлагает им за два года освоить область машинного обучения и анализа данных.
Что должен знать и уметь абитуриент?
Поступить в магистратуру с нулевыми знаниями программирования и высшей математики не получится. «Машинное обучение и анализ данных» предполагает, что у абитуриента есть минимальный уровень подготовки. Руководство программы рекомендует пройти несколько онлайн-курсов перед поступлением чтобы изучить или повторить, например, основы теории вероятности и языка Python.
Однако знания — не единственный критерий отбора абитуриентов.
Алексей Александрович Шпильман, академический руководитель программы «Машинное обучение и анализ данных»:
«За два года студенты программы проходят интенсивный курс в области машинного обучения и анализа данных. При этом магистратура не требует от абитуриента высокого уровня подготовки. Нужно лишь базовое понимание математики и информатики.
Нам [руководству программы] важно, чтобы поступающий был замотивирован и понимал, с чем ему предстоит столкнуться на программе. У нас большое количество пар, и они, в основном, дневные. Магистранту придется интенсивно работать и многое изучать самостоятельно. На собеседовании мы хотим понять, готов ли он к этому. Очень часто мы сталкиваемся с тем, что студенты оказываются не готовы к нагрузке. Больше всего удивляет их количество домашних работ и проектов, которое у нас в разы больше чем то, к чему они привыкли в бакалавриате».
Чем перспективны направления машинного обучения и анализа данных?
Искусственный интеллект — одна из наиболее сильно развивающихся областей науки и техники. А машинное обучение и анализ данных — это как раз практическая часть искусственного интеллекта. То, что работает. Во многих компаниях искусственный интеллект уже применяется и будет применяться еще чаще, и специалистов с каждым годом нужно все больше.
Во многих областях человеческой деятельности, существует непрерывный поток информации. Это большие объемы данных, которые человек не может обработать физически. С этим справляются машины. Они помогают в логистике, продажах, работе с социальными сетями, в биоинформатике и так далее. Компаниям из всех секторов экономики нужны специалисты, которые умеют обращаться с машинами, обрабатывать и анализировать данные с их помощью. Они также востребованы за рубежом.
Как происходит обучение на программе?
На первом году обучения во время осеннего модуля магистранты проходят курсы по алгебре, теории вероятности и математической статистике. Это сделано для того, чтобы повторить материал, который студенты учили в бакалавриате или осваивали самостоятельно. Также мы улучшаем их базовые знания языка Python и учим создавать и грамотно вести IT-проект. Затем студенты проходят базовые курсы по машинному обучению, глубокому обучению, анализу естественного языка и анализу изображений.
На втором году программы начинаются специализированные курсы. Например, студенты учатся работать с алгоритмами и программным обеспечением для обучения беспилотных автомобилей. Они также изучают алгоритмы обучения без учителя, генеративные модели, нейробайесовские методы. В результате за 2 года магистранты постепенно осваивают область машинного обучения и анализа данных — от азов до последних достижений в науке и индустрии.
Как устроена научная и проектная деятельность в магистратуре?
На программе студенты занимаются обязательной проектной деятельностью. Она начинается в весеннем семестре первого года обучения. Проекты предлагают партнерские компании и исследовательские лаборатории, а также преподаватели НИУ ВШЭ — Санкт-Петербург.
Некоторые компании и лаборатории делают тестовые задания для желающих. Магистранту нужно выполнить их, чтобы попасть в команду. Студент может выбрать несколько проектов, пройти все входные тесты, а затем решить, чем именно хочет заниматься. По итогам семестра, нужно презентовать результаты своей работы.
Студенты магистратуры защищают свои первые исследовательские или прикладные проекты в конце первого года обучения. Затем на втором году обучения они выполняют еще два проекта: осенью и весной. Это могут быть два разных проекта или один, который студент развивает после осенней защиты и представляет как часть магистерской диссертации. Весной на втором курсе почти все занятия на программе заканчиваются и магистранты могут сосредоточиться на своем научном исследовании.
Летом между первым и вторым курсом студенты могут съездить в летние школы или пройти стажировки в партнерских компаниях программы.
В каких лабораториях и центрах можно работать над проектами?
Проектной деятельностью можно заниматься и в Центре анализа данных и машинного обучения НИУ ВШЭ — Санкт-Петербург. Им заведует Алексей Александрович Шпильман. Студенты Питерской Вышки могут проходить стажировки и выполнять проекты в этих лабораториях.
В январе 2021 года магистранты и сотрудники программы заняли третье место в соревновании NeurIPS 2020: Black-Box Optimization Challenge. А в 2019 году команда центра выиграла соревнования на Международной конференции робототехники ICRA 2019 в Монреале. Почитать подробнее о соревнованиях и работе команды можно в интервью со студентом программы «Машинное обучение и анализ данных» Никитой Сазановичем.
Чем могут заниматься выпускники программы?
Специалист может заниматься машинным обучением по заказу. К примеру, медицинская компания просит обучить компьютер, чтобы он определял по рентгеновским снимкам заболевания на ранних стадиях. Машина сделает это точнее, чем человек. В случае с такой задачей, специалист не разрабатывает новые методы обучения, а использует уже существующие. Ему нужно понять, какие из них лучше использовать для решения задачи и адаптировать под заказчика. Подобные задачи могут поступать из разных областей. Специалист должен знать методы оптимизации, исследования операций, математическую статистику и другие направления прикладной математики, которые составляют базу машинного обучения.
Второй вариант деятельности более научный — это работа не над прикладными задачами, а с самими методами машинного обучения. Специалист может изучать методы, заниматься улучшением или созданием алгоритмов обучения. В этом случае, ему нужны очень глубокие знания математики.
Какие вступительные испытания ждут абитуриентов?
Алексей Александрович Шпильман, академический руководитель программы «Машинное обучение и анализ данных»:
«Вступительные экзамены состоят из двух частей. Первая — письменный экзамен. На нем студенту нужно решить некоторые несложные задачки по математике — теории вероятности, линейной алгебре и так далее. В экзамене также есть задания на проверку базовых навыков программирования.
Вторая часть — собеседование. На собеседовании мы пытаемся понять, насколько человек замотивирован учиться, какие у него были проекты, чем он хочет заниматься на программе. Это возможность «вытащить» из абитуриента все его лучшие стороны и разобраться, в чем он силен. Абитуриент также может задать свои вопросы о программе. Мы отвечаем и рассказываем, как устроено обучение.
Человек должен понимать, что программа очень трудозатратная, у него вряд ли получится совмещать учебу и работу. Этот момент мы стараемся компенсировать стипендиями. Абитуриента ждут два трудных, но интересных года. По окончании программы он сможет претендовать на высокие зарплаты от 150 тыс. рублей».
Шпильман Алексей Александрович
Заведующий Центром анализа данных и машинного обучения