Исследователи Питерской Вышки выиграли в федеральном конкурсе «Код – Искусственный интеллект»
Конкурс «Код-ИИ» проходит в рамках федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика». Цель конкурса — создание новых и развитие существующих открытых библиотек в сфере искусственного интеллекта. Заявки на «Код-ИИ» принимались по пяти направлениям: компьютерное зрение, обработка естественного языка, распознавание и синтез речи, интеллектуальные системы поддержки принятия решений и перспективные методы искусственного интеллекта.
Одним из победителей конкурса по последнему направлению стал проект сотрудников НИУ ВШЭ — Санкт-Петербург «Открытая библиотека с набором сред для обучения автономных агентов обучения с подкреплением». Над проектом будет работать команда из четырех исследователей:
-
Владимир Егоров, студент 2-го курса магистерской программы «Программирование и анализ данных»;
-
Олег Свидченко, аспирант 1-го года обучения, выпускник бакалаврской и магистерской программ факультета;
-
Дмитрий Иванов, младший научный сотрудник Международной лаборатории теории игр и принятия решений;
-
Алексей Шпильман, академический руководитель магистерской программы «Машинное обучение и анализ данных», заведующий Центром анализа данных и машинного обучения.
В рамках проекта исследователи создадут и опубликуют в публичном репозитории открытую библиотеку для обучения с подкреплением.
Владимир Егоров, студент магистратуры «Программирование и анализ данных», идеолог проекта
Многие исследователи считают, что обучение с подкреплением наиболее близко подходит к описанию общего ИИ, так как позволяет управлять агентом в любой среде, будь то реальный мир или компьютерная игра. Это подтверждают и недавние результаты: победа алгоритма OpenAI Five над чемпионами мира в Dota 2 или достижение уровня грандмастера в StarCraft 2 алгоритмом DeepMind AlphaStar. Однако все эти прорывы доступны только крупным компаниям с огромными вычислительными ресурсами.
Наш проект призван помочь исследователям в области обучения с подкреплением изучать новые алгоритмы на ресурсо-доступных средах, которые тем не менее требуют сложных взаимодействий между агентами. Многие нетривиальные поведения агентов уже были описаны в экономической литературе, например, дилемма заключенного. Однако их реализации в сфере обучения с подкреплением не дают полноценного представления о преимуществах алгоритма, так как зачастую являются простой адаптацией матричных игр. В нашем проекте мы хотим сохранить достаточную сложность для каждой среды, позволяющую судить о преимуществах алгоритма с практической точки зрения. Другая важная особенность нашего проекта — это наличие как соревновательных, так и кооперативных элементов в предложенных средах.
Всего на конкурс было подано 50 заявок, поддержку получили 15 проектов. Грант в размере 8 миллионов рублей рассчитан на один год.
Иванов Дмитрий Игоревич
Международная лаборатория теории игр и принятия решений: Младший научный сотрудник
Свидченко Олег Анатольевич
Центр анализа данных и машинного обучения: Приглашенный преподаватель
Шпильман Алексей Александрович
Заведующий Центром анализа данных и машинного обучения