«Не упущу возможность создать прикладной проект вместе с командой»
Таисия Чегодаева — первокурсница программы «Прикладной анализ данных и искусственный интеллект». В 2023 году она участвовала в Школе по практическому программированию и анализу данных, которую проводит Питерская Вышка совместно с VK, генеральным партнером проекта. Студентка погрузилась в работу диффузионных моделей и нашла друзей, а в этом году и сама станет куратором Школы. Накануне проектного этапа соревнований, который стартует 6 мая в Кочубей-центре, Таисия рассказывает, как создала с командой проект от VK и кому стоит участвовать в Школе.
— Таисия, расскажите, почему вы решили поучаствовать в Школе по практическому программированию и анализу данных?
— Я узнала о ней еще в десятом классе из рассылки Питерской Вышки. Мне очень понравилась концепция Школы: не упущу возможность создать прикладной проект вместе с командой. Но подалась я только в 11-м классе, потому что к тому моменту у меня за плечами уже было призерство в олимпиаде по искусственному интеллекту. И я предполагала, что у меня будет больше шансов пройти.
— Что нового вы узнали во время дистанционного этапа Школы — лекций от преподавателей и партнеров кампуса?
— В мой год на заочном этапе Школы было много лекций по машинному обучению. Я довольно хорошо разбиралась в этой теме благодаря олимпиадам по ИИ и многое уже знала. И все же некоторые знания оказались для меня в новинку. Особенно порадовали лекции от индустриальных партнеров. Помню, как одна из компаний рассказывала, как проводила среди своих сотрудников конкурс на создание лучшей рекомендательной системы для пользователей. Я бы и сама хотела работать в такой корпоративной среде, да и тема для меня была совершенно новая. Затем я прошла контест по машинному обучению, и меня пригласили на очный этап.
— Расскажите, какой проект вы реализовали в рамках очного этапа?
— На очном этапе проектной школы мы реализовали проект от компании VK — бота, с помощью которого пользователи могли генерировать стикеры по фотографиям и текстовому описанию. Алгоритмы смешивали фото пользователя с изображением из стикерпака и удаляли ненужный фон.
Наша команда не заняла призового места, и все же жюри очень понравился наш бот. Они отметили, что мы проделали большую работу с технической точки зрения. Но на будущее посоветовали больше обращать внимание на метрики и продуктовые результаты. А еще этот проект очень похож на тот, над которым мы работаем сейчас на программе «Прикладной анализ данных и искусственный интеллект». Так что опыт очень пригодился!
— Кто помогал вам в реализации проекта?
— У нас был наставник — Александр Рогачев, старший программист-исследователь в команде компьютерного зрения в VK. Он давал советы с продуктовой точки зрения: как лучше описать продукт или продумать интерфейс. А еще подсказал, что при выборе больших моделей нужно всегда ориентироваться на их метрики и характеристики, сравнивать их между собой. Было очень полезно!
Например, мы остановили свой выбор на диффузионной модели Stable Diffusion. Эту модель, в отличие от других, можно легко дообучить при помощи дополнительной архитектуры и тем самым придать изображениям желаемый стиль. Вместе с наставником мы даже написали статью по тем наработкам, которые у нас появились к концу Школы. Теперь она опубликована на Хабре.
Помимо наставника из VK, у нас был куратор — студент Питерской Вышки Егор Кокуш. В перерывах между работой над проектом он рассказывал о своих впечатлениях от учебы и о том, какие курсы ему нравятся. Еще он поделился, что в кампусе царит классная атмосфера, благодаря тому что все вокруг постоянно учатся. Во многом он меня и мотивировал поступать сюда.
— С какими трудностями вы столкнулись, разрабатывая бота?
— Накануне защиты проектов мы столкнулись с такой проблемой: когда несколько пользователей сразу пытались загрузить изображение, картинка сохранялась только у кого-то одного, из-за чего все получали один и тот же стикер. По-хорошему, нам следовало прикрутить базу данных, но мы использовали что-то наподобие словаря. Из-за этого данные пользователей записывались не туда, куда нужно. На самом деле, трудность была не такая уж и большая, мы довольно быстро все починили. Просто мы все уже устали к концу Школы — глаз замылился.
— Школа по практическому программированию и анализу данных проходила в Кочубей-центре. Как вам атмосфера этого места? И как выглядел ваш день?
— Пушкин — очень красивый город. Кочубей-центр мне тоже понравился — тихое место, где можно спокойно посидеть в одиночестве и что-то покодить. В один из дней нас водили в музей-заповедник «Царское Село» на экскурсию. Было здорово — мы все перезнакомились друг с другом и обсудили разные темы.
А расписание в течение дня было таким. Сперва завтрак, потом — командная работа до обеда и ужина. Кроме того, почти каждый день были лекции от индустриальных партнеров Школы. Далее — свободное время, которое наша команда зачастую тратила на проект. Может быть, это было и зря: другие ребята играли в настольные игры, вместе смотрели фильмы да и просто болтали и отдыхали. И все же друзей я тоже обрела! Один из моих сокомандников теперь мой одногруппник. Для меня было большой радостью в сентябре встретить знакомого человека на факультете — так проще освоиться в новой среде. Еще один мальчик из команды сейчас учится в 11-м классе. Мы поддерживаем общение, а летом участвовали в разных хакатонах.
— Как вы считаете, кому стоит участвовать в Школе по практическому программированию и анализу данных?
— Всем, кому интересны эти направления! К тому же Школа — это отличная возможность научиться работать в команде, найти друзей. Возможно, кто-то из ваших сокомандников станет вашем однокурсником или коллегой, и полезные знакомства пригодятся вам в будущем. А еще воплощенный проект может стать отличной строчкой в резюме, что для начинающих специалистов особенно ценно.
— Расскажите, почему вы выбрали программу «Прикладной анализ данных и искусственный интеллект»?
— Интерес к искусственному интеллекту возник у меня еще в 10–11-м классах. Мне кажется, что ИИ — это своего рода искусство. Приходится нестандартно мыслить и креативить, чтобы решать задачи в этой области, а мне такое нравится. К тому же многие мои знакомые из олимпиадной среды учатся в Питерской Вышке. Они делятся классными впечатлениями и рассказывают, что программа — серьезная, учиться на ней не так просто. А я люблю сложности, поэтому решила, что для меня это — идеальный вариант.
— Вы упомянули, что работаете над учебным проектом по машинному обучению. О чем идет речь?
— В качестве курсовой работы мы с одногруппниками создаем прикладной проект по искусственному интеллекту. Разрабатываем чат-бота, который позволит любому пользователю мессенджера сгенерировать свой анимированный стикер с определенной эмоцией. В целом, этот проект — не самый простой для нашего возраста, но знаний и умений у нас достаточно.
Для начала нам нужно обучить модели переносить все основные черты с фотографии, которую загрузит пользователь, в стикер. Затем при помощи дополнительных моделей сгенерировать его анимацию. Сложность в том, что не все модели одинаково хорошо работают и на человеческих лицах, и на других объектах. Пока мы остановились на инструменте instruct pix2pix — его можно обучить на инструкциях, но генерировать изображение он сможет практически без дополнительных текстов в данных. Еще планируем попробовать модель Instant ID.
— Поделитесь, какие у вас впечатления от обучения?
— Впечатлений у меня много! Здесь действительно непросто учиться, но мне даже нравится. Преподаватели помогают не терять настрой тем, что относятся к нам как к коллегам и всегда готовы ответить на любой вопрос. Коллектив студентов и преподавателей — такой, каким я его себе и представляла, когда поступала, — все очень талантливые, умные и дружелюбные.
Но главное, что меня радует, — то, с какой скоростью увеличиваются мои знания. В первом семестре у меня был довольно объемный курс по С++, мы много тем затронули. Несмотря на то, что курс длился всего полгода, мы изучили много новых тем, которые раньше казались мне недоступными. Кроме того, в школе я очень боялась задач по алгоритмам. А на вышкинском курсе так глубоко в них погрузилась, что стала увереннее себя чувствовать при решении задач!