дек

2021

Исследователи Питерской Вышки выиграли в федеральном конкурсе «Код – Искусственный интеллект»

Конкурс «Код-ИИ» — часть национальной программы «Цифровая экономика». Команда исследователей Школы физико-математических и компьютерных наук под руководством Алексея Шпильмана стала одной из 15, чей проект был поддержан в рамках этого конкурса. Исследователи получат грант в размере 8 млн рублей на создание открытой библиотеки для обучения с подкреплением.

Конкурс «Код-ИИ» проходит в рамках федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика». Цель конкурса — создание новых и развитие существующих открытых библиотек в сфере искусственного интеллекта. Заявки на «Код-ИИ» принимались по пяти направлениям: компьютерное зрение, обработка естественного языка, распознавание и синтез речи, интеллектуальные системы поддержки принятия решений и перспективные методы искусственного интеллекта.

Одним из победителей конкурса по последнему направлению стал проект сотрудников НИУ ВШЭ — Санкт-Петербург «Открытая библиотека с набором сред для обучения автономных агентов обучения с подкреплением». Над проектом будет работать команда из четырех исследователей:

Владимир Егоров, студент 2-го курса магистерской программы «Программирование и анализ данных»;
Олег Свидченко, аспирант 1-го года обучения, выпускник бакалаврской и магистерской программ факультета;
Дмитрий Иванов, младший научный сотрудник Международной лаборатории теории игр и принятия решений;
Алексей Шпильман, академический руководитель магистерской программы «Машинное обучение и анализ данных», заведующий Центром анализа данных и машинного обучения.

В рамках проекта исследователи создадут и опубликуют в публичном репозитории открытую библиотеку для обучения с подкреплением.

Владимир Егоров, студент магистратуры «Программирование и анализ данных», идеолог проекта

Многие исследователи считают, что обучение с подкреплением наиболее близко подходит к описанию общего ИИ, так как позволяет управлять агентом в любой среде, будь то реальный мир или компьютерная игра. Это подтверждают и недавние результаты: победа алгоритма OpenAI Five над чемпионами мира в Dota 2 или достижение уровня грандмастера в StarCraft 2 алгоритмом DeepMind AlphaStar. Однако все эти прорывы доступны только крупным компаниям с огромными вычислительными ресурсами.

Наш проект призван помочь исследователям в области обучения с подкреплением изучать новые алгоритмы на ресурсо-доступных средах, которые тем не менее требуют сложных взаимодействий между агентами. Многие нетривиальные поведения агентов уже были описаны в экономической литературе, например, дилемма заключенного. Однако их реализации в сфере обучения с подкреплением не дают полноценного представления о преимуществах алгоритма, так как зачастую являются простой адаптацией матричных игр. В нашем проекте мы хотим сохранить достаточную сложность для каждой среды, позволяющую судить о преимуществах алгоритма с практической точки зрения. Другая важная особенность нашего проекта — это наличие как соревновательных, так и кооперативных элементов в предложенных средах.

Всего на конкурс было подано 50 заявок, поддержку получили 15 проектов. Грант в размере 8 миллионов рублей рассчитан на один год.

Дата

21 декабря 2021

Рубрики

Наука

Темы

достижения профессора инновации магистратура аспирантура

В статье упомянуты

Магистерская программа «Машинное обучение и анализ данных», Магистерская программа «Программирование и анализ данных», НИУ ВШЭ в Санкт-Петербурге, Санкт-Петербургская школа физико-математических и компьютерных наук, Центр анализа данных и машинного обучения

Персоны

Иванов Дмитрий Игоревич

Международная лаборатория теории игр и принятия решений: Младший научный сотрудник

Свидченко Олег Анатольевич

Центр анализа данных и машинного обучения: Приглашенный преподаватель

Шпильман Алексей Александрович

Заведующий Центром анализа данных и машинного обучения