• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Исследователи Питерской Вышки выиграли в федеральном конкурсе «Код – Искусственный интеллект»

Конкурс «Код-ИИ» — часть национальной программы «Цифровая экономика». Команда исследователей Школы физико-математических и компьютерных наук под руководством Алексея Шпильмана стала одной из 15, чей проект был поддержан в рамках этого конкурса. Исследователи получат грант в размере 8 млн рублей на создание открытой библиотеки для обучения с подкреплением.

Исследователи Питерской Вышки выиграли в федеральном конкурсе «Код – Искусственный интеллект»

© ru.freepik.com

Конкурс «Код-ИИ» проходит в рамках федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика». Цель конкурса — создание новых и развитие существующих открытых библиотек в сфере искусственного интеллекта. Заявки на «Код-ИИ» принимались по пяти направлениям: компьютерное зрение, обработка естественного языка, распознавание и синтез речи, интеллектуальные системы поддержки принятия решений и перспективные методы искусственного интеллекта.

Одним из победителей конкурса по последнему направлению стал проект сотрудников НИУ ВШЭ — Санкт-Петербург «Открытая библиотека с набором сред для обучения автономных агентов обучения с подкреплением». Над проектом будет работать команда из четырех исследователей:

В рамках проекта исследователи создадут и опубликуют в публичном репозитории открытую библиотеку для обучения с подкреплением.

Владимир Егоров, студент магистратуры «Программирование и анализ данных», идеолог проекта

Многие исследователи считают, что обучение с подкреплением наиболее близко подходит к описанию общего ИИ, так как позволяет управлять агентом в любой среде, будь то реальный мир или компьютерная игра. Это подтверждают и недавние результаты: победа алгоритма OpenAI Five над чемпионами мира в Dota 2 или достижение уровня грандмастера в StarCraft 2 алгоритмом DeepMind AlphaStar. Однако все эти прорывы доступны только крупным компаниям с огромными вычислительными ресурсами.

Наш проект призван помочь исследователям в области обучения с подкреплением изучать новые алгоритмы на ресурсо-доступных средах, которые тем не менее требуют сложных взаимодействий между агентами. Многие нетривиальные поведения агентов уже были описаны в экономической литературе, например, дилемма заключенного. Однако их реализации в сфере обучения с подкреплением не дают полноценного представления о преимуществах алгоритма, так как зачастую являются простой адаптацией матричных игр. В нашем проекте мы хотим сохранить достаточную сложность для каждой среды, позволяющую судить о преимуществах алгоритма с практической точки зрения. Другая важная особенность нашего проекта — это наличие как соревновательных, так и кооперативных элементов в предложенных средах.

Всего на конкурс было подано 50 заявок, поддержку получили 15 проектов. Грант в размере 8 миллионов рублей рассчитан на один год.