• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Студенты Питерской Вышки заняли первое место в соревновании NeurIPS 2020: Flatland

Команда JBR_HSE, состоящая из студентов и преподавателей Санкт-Петербургской школы физико-математических и компьютерных наук, заняла первое место в соревновании NeurIPS 2020: Flatland, трек «обучение с подкреплением». Участие происходило в сотрудничестве с лабораторией Агентных систем и обучения с подкреплением JetBrains Research.

Студенты Питерской Вышки заняли первое место в соревновании NeurIPS 2020: Flatland

© iStock

Соревнование проходило под эгидой одной из самых крупных и известных международных конференций по машинному обучению — NeurIPS. Участники NeurIPS 2020: Flatland разрабатывали алгоритм, способный как можно лучше управлять трафиком движения поездов по сети железных дорог, при этом система должна принимать решения за ограниченное время. 

Соревнование проходило в два этапа с 1 июня по 6 ноября, после жюри конкурса проверяло решения финалистов. В NeurIPS 2020: Flatland было два направления: общее и Reinforcement Learning (RL). Первое направление было открыто для любых решений, а второе только для решений, использующих обучение с подкреплением —  область машинного обучения, которая специализируется на задачах взаимодействия со средой (в данном случае роль среды выполнял симулятор железной дороги). Команда JBR_HSE заняла первое место в RL-треке и восьмое в общем зачете.

В команду вошли:

Участие в соревновании стало возможным благодаря сотрудничеству с лабораторией Агентных систем и обучения с подкреплением JetBrains Research. Олег, Владимир и Дмитрий являются сотрудниками, а Константин — стажером лаборатории.

Алексей Шпильман, заведующий Центром анализа данных и машинного обучения НИУ ВШЭ — Санкт-Петербург, заведующий лабораторией Агентных систем и обучения с подкреплением JetBrains Research

Соревнование Flatlands призвано было оценить, насколько методы обучения с подкреплением подходят для такой сложной задачи, как составление оптимального расписания движения поездов. Причем под расписанием подразумевается не только время старта, но и скоростной режим, то есть параметров для варьирования — огромное множество. Задача не решается стандартными методами, но есть несколько эвристических алгоритмов, дающих хорошие результаты. Организаторы соревнования хотели выяснить, могут ли современные методы обучения с подкреплением обойти эвристики.

Подобные соревнования — это один из основных двигателей машинного обучения. Текущая золотая эра глубокого обучения началась с победы сети AlexNet в соревновании ImageNet Challenge. Такие состязания позволяют реально оценить работоспособность того или иного метода: в научных статьях мы часто сталкиваемся с методами, не являющимися на самом деле конкурентоспособными. И соревнования помогают найти в мириаде решений те, которые в дальнейшем будет использовать большая часть индустрии. 

Наша команда JBR_HSE состоит из ребят, которые ранее уже успешно участвовали в соревнованиях. Подготовка к Flatlands заключалась в обучении новичков и создании удобного фреймворка для апробации алгоритмов. Решение, которое мы получили, можно модифицировать и использовать на практике. Правда оно все еще проигрывает эвристическим алгоритмам, но мы планируем найти улучшения, исправляющие этот момент.

Победители выиграли тревел-грант для поездки на международную конференцию и видеокарту RTX 2080. Также участники команды совместно с организаторами соревнования готовят публикацию в NeurIPS Competition Book.

Поздравляем победителей и желаем новых достижений!