Студенты Питерской Вышки заняли первое место на хакатоне Tech Day от VK
С 5 по 7 августа в Москве и Петербурге прошел Tech Day с Инженерно-математической школой НИУ ВШЭ и VK. Хакатон объединил студентов-программистов из топовых вузов страны: Сколтеха, МГТУ им. Н. Э. Баумана, ИТМО, НИУ ВШЭ и других. В течение трех дней участники посещали митапы от экспертов Вышки и компании VK, а также боролись за звание чемпионов в хакатоне. Победу одержала команда «Академщики», в составе которой — двое студентов программы «Прикладной анализ данных и искусственный интеллект» Питерской Вышки и студент МГТУ им. Н. Э. Баумана.
В течение двух дней участники решали задачу команды платформы VK Реклама на основе данных. Командам предстояло создать модель машинного обучения, которая сможет предсказывать пол пользователей соцсетей и контентных платформ. Это необходимо, чтобы бизнес мог показывать свои товары и услуги целевой аудитории и привлекать как можно больше клиентов на каждый вложенный в продвижение рубль. Работы конкурсантов оценивали эксперты из НИУ ВШЭ и VK.
Антон Кузнецов, руководитель Мастерской по виртуальным платформенным решениям Инженерно-математической школы НИУ ВШЭ и VK (ИМШ)
Наша идея была в том, чтобы создать такой проект, где ребята смогут не только послушать лекции, но и сделать что-нибудь руками. Так и появился Tech Day — одновременно серия митапов и хакатон, где участники работают с реальными, а не абстрактными данными. Вместе с VK мы взяли пример типовой задачи, с которой сталкиваются специалисты цифровых сервисов. Такой подход полезен всем: и компаниям, и участникам. Ребята учатся применять знания на практике и получают новый опыт, а VK присматривает кандидатов для стажировок. Подобные задачи компания запускает не впервые: аналогичные кейсы уже были опробованы участниками других соревнований. Решение одной из команд прошлого года попало в компанию и используется там до сих пор, поэтому — все возможно. В этом году уровень подготовки участников тоже очень высокий!
В составе команды «Академщики» в хакатоне приняли участие студенты программы «Прикладной анализ данных и искусственный интеллект» Питерской Вышки Илья Кулешов и Павел Ильин. В финальном решении они предложили использовать ансамбль из нескольких моделей градиентного бустинга CatBoost. На вход моделям студенты подавали признаки из предложенного датасета и эмбеддинги, созданные с помощью pytorch-lifestream.
По итогам соревнований команда «Академщики» вместе с Ильей Кулешовым и Павлом Ильиным заняла первое место. Студенты выиграли денежный приз в размере 200 тысяч рублей.
Илья Кулешов, 2-й курс, ОП «Прикладной анализ данных и искусственный интеллект»
В хакатонах я принимаю участие со школы, это моя не первая победа. В соревнованиях от VK мы тоже участвовали не раз — интересные задачи, четкая организация, классные метрики. Tech Day тоже не прошел мимо нас и оставил приятные впечатления. Больше всего понравилось сотрудничать с экспертами из VK — они быстро отвечали на наши вопросы и давали действительно полезные советы. Нам сильно помогло и то, что у нас уже был опыт решения похожих заданий на других хакатонах.
Метод градиентного бустинга хорош тем, что создает предсказания, объединяя множество простых моделей. Каждая из таких моделей делает свою небольшую часть работы, а потом все предсказания объединяются в одно, более точное предсказание. Эмбеддинги мы создали с помощью pytorch-lifestream, который помогает преобразовывать данные в удобные для анализа форматы. Необходимый опыт для решения таких задач я приобрел в университете и на работе — я являюсь старшим инженером по разработке в SberDevices.
Павел Ильин, 2-й курс, ОП «Прикладной анализ данных и искусственный интеллект»
Машинным обучением я интересуюсь с 10-го класса, еще в школе начал работать в этой сфере и сейчас занимаю должность middle data scientist в банке «Точка». Поэтому задачу было решать не трудно, хотя и интересно. Да и с Ильей мы участвуем в конкурсах и хакатонах не впервые, так что работа была продуктивной и стабильной. В ходе решения задачи мы заметили, что данные для тестирования и обучения в некоторых местах совпадали. Мы решили объединить данные и использовали для обучения все, у которых есть метка. Мало кто из команд-конкурентов заметил эту фичу, а она давала сильный буст.
Работу участников курировали менторы из компании VK. Одним из них стала Юлиана Шахвалиева — выпускница магистерской программы Питерской Вышки «Машинное обучение и анализ данных» и ИМШ. В ИМШ Юлиана участвовала в проекте от VK, где создавала систему мониторинга аномалий для сервисов компании. По итогам проектной работы выпускницу пригласили в команду прикладных исследований DeepVK, которая занимается обработкой естественного языка. «Я впервые была ментором, это волнительный, но очень классный опыт. Команда, которая заняла первое место, была очень вовлечена в работу. Так и должно быть — нетривиальные задачи требуют целеустремленности. Ребята молодцы!» — делится Юлиана.
Инженерно-математическая школа — совместный образовательный проект НИУ ВШЭ и VK. Студенты ИМШ занимаются реальными проектами и задачами VK и получают ежемесячную стипендию в размере 40 000 рублей. В рамках проекта в Питерской Вышке два года назад появилась Мастерская по виртуальным платформенным решениям. Там ребята решают задачи, связанные с NLP, виртуальными облачными решениями и генеративной обработкой изображений. Узнать подробнее.