«Видно, что ребята прошли серьезный отбор»: завершилась Школа по практическому программированию и анализу данных
В мае в «Кочубей-центре» прошел очный этап Школы по практическому программированию и анализу данных. Он был организован Питерской Вышкой при поддержке VK и других партнеров. В проекте приняли участие 50 старшеклассников из 15 городов России — от Петербурга до Курска. Первое место взяла команда с проектом о компьютерном зрении и фармацевтике, над которым ребята работали с наставником из BIOCAD. Как прошло мероприятие — в материале редакции.
Первый этап Школы по практическому программированию и анализу данных состоялся в феврале. Его участниками стали более 300 старшеклассников. Пять дней они слушали лекции от преподавателей Питерской Вышки и компаний-партнеров, в числе которых — VK, «Тинькофф», «Сбер», BIOCAD, «1С» и другие. VK выступил в качестве генерального партнера проектной Школы. Завершающим этапом стал контест по машинному обучению, по результатам которого лучшие старшеклассники прошли во второй, очный этап.
Очный этап проходил с 1 по 6 мая. Участники разделились на команды, слушали лекции по машинному обучению, анализу данных, но главное — занимались реальными проектами от лабораторий Питерской Вышки и компаний-партнеров. В работу со старшеклассниками были включены эксперты VK, BIOCAD и «Тинькофф», а также проектный центр компании «1С», Лаборатория естественного языка ВШЭ-Яндекс и Центр анализа данных и машинного обучения.
Школа по практическому программированию и анализу данных стала логичным продолжением проектного подхода на факультете. Ведь с проектами сталкиваются все первокурсники, которые попадают на «Прикладную математику и информатику» или «Прикладной анализ данных и искусственный интеллект». Здесь была схожая задача — показать школьникам, что можно сразу включаться в полезные для индустрии задачи. При этом Школа помогает выровнять уровень знаний старшеклассников и готовит их к поступлению в вузы.
Михаил Мухин, декан Школы физико-математических и компьютерных наук
Есть достаточно много проектов, посвященных олимпиадным задачам. Такая гимнастика для ума действительно популярна и интересна, но при этом мест, где школьники могут поработать над реальными проектами, не так много. А между тем, это разные навыки — знать трюки, чтобы щелкать олимпиадные задачки, и уметь искать информацию, которую можно применить к настоящему проекту.
Наша Школа помогает участникам увидеть, из чего состоит прикладной проект на самом деле. Как идет распределение ролей в команде, как происходит взаимодействие между участниками, какие задачи нужно решать, с какими трудностями сталкиваются по ходу выполнения проектов, почему необходимо соблюдать дедлайны. И отдельно отмечу, что школьники начинают понимать, насколько на самом деле важны выступление и презентация при оценке проектов. Ведь жюри уже видит итог, а не работу над проектом — все как на обычных продуктовых презентациях в компании. Учиться такому заранее — полезно. Двойной плюс — что ребятам с проектами помогали компании-партнеры, так что школьники получали знания об индустрии из первых рук.
В финальном этапе школьники разделились на девять команд и выбрали проекты для работы. Первый касался того, как наиболее эффективно разместить нефтедобывающие скважины с помощью методов обучения с подкреплением. При этом школьникам важно было учесть размер и пористость нефтяного месторождения, а также то, насколько глубоко находятся залежи нефти. Наставником на проекте был Олег Свидченко, преподаватель и аспирант департамента информатики.
Один из проектов от «Тинькофф» был посвящен модерации постов в соцсети «Пульс» для инвесторов. Итоговым продуктом школьников стал Telegram-бот, который умеет обнаруживать в публикациях манипуляции рынком, рекламу, обсценную лексику и попрошайничество. На примере двух проектов от VK школьники учились генерировать стикеры. В первом случае алгоритмы смешивали фото пользователя с изображением из стикерпака и удаляли ненужный фон. Во втором нужно было сгенерировать новые стикеры на основе эмодзи и уже существующих пакетов.
Александр Рогачев, старший программист-исследователь команды компьютерного зрения VK
VK Education активно поддерживает проекты, развивающие компетенции в области анализа данных и машинного обучения. Мы рады выступить партнером Школы по практическому программированию и анализу данных и предоставить ребятам интересные кейсы. Было приятно увидеть, что многие команды занимались не только ML-частью проектов, но и думали над их дальнейшим развитием: создавали ботов и даже интегрировали свои решения в браузеры. Хотел бы также отметить высокие soft-скиллы многих участников Школы. Ребята позаботились о том, чтобы сопроводить решение кейса яркой вовлекающей презентацией. Она позволяет не только привлечь внимание к проекту, но и является заметным маркером того, что команда увлечена тем, что делает. Спасибо участникам за атмосферу и участие!
Был и полностью исследовательский проект от Лаборатории естественного языка ВШЭ-Яндекс — про предсказание буллинга в школе. Старшеклассники разработали бота, который по контексту фразы пытался определить, подвергается ли травле автор сообщения. Однако для более точных предсказаний школьникам не хватило размеченных данных.
Первое место в финале заняли шесть школьников с проектом про фармацевтику. Победителями стали Роберт Арифулин, Дмитрий Гейжа, Андрей Крюков, Александр Рассказчиков, Софья Тищенко и Валерия Чунихина. Под руководством аналитика из BIOCAD Ксении Балабаевой, выпускницы Питерской Вышки, ребята учились искать бракованные шприцы среди партии из 160 штук с помощью компьютерного зрения и машинного обучения. Важным условием было то, чтобы на обработку данных уходило менее 10 секунд. По фотографиям старшеклассники научили алгоритмы отличать слоты без шприцов, а также бракованные шприцы от нормальных.
Ксения Балабаева, аналитик данных в биотехнологической компании BIOCAD
Это реальный проект, который находится в BIOCAD на этапе исследования. Мы решили поработать над этой задачей на Школе по практическому программированию и анализу данных, чтобы получить свежий взгляд и идеи, попробовать сложные и простые методы. Вклад ребят очень ценен, и мы продолжим развивать их решение. Реализация подобных IT-проектов в фармотрасли позволяет значительно влиять на эффективность разработки и производства лекарственных препаратов, а значит, пациенты смогут быстрее получить доступ к жизненно важной терапии.
Впечатления от Школы у участников и у меня положительные. Видно, что ребята прошли серьезный отбор, они уже многое умели делать. Для меня было большим удовольствием с ними работать, ведь наставник не только обучает своих подопечных, но и сам учится у них. Больше всего мне нравится легкость и непосредственность, с которой команда подходила к задачам. Нет шаблонности, которая часто свойственна взрослым. Ребята абсолютно свободны в своих решениях и при этом очень мотивированы.
Александр Рассказчиков, 11-й класс, Москва
Школа очень классная! Кейсы — применимые, прикладные, они помогают прокачать свои навыки. Мы понимаем, что работаем над важными задачами и результаты не уходят в никуда. Даже после завершения проектной школы наша работа не заканчивается.
Проект от BIOCAD зацепил меня больше всего, потому что я был в «Сириусе» в прошлом году и компания показывала там очень интересный проект. Мне захотелось погрузиться в технологии на стыке биологии, химии и информатики. Образование я хочу продолжить в этом ключе — хотел бы дальше заняться бизнес-информатикой.
Второе место заняла команда с проектом по поиску биржевого сленга в соцсети для инвесторов «Пульс». Задачей было придумать решение, которое поможет новичкам платформы быстрее разобраться в непонятных словах и стать частью сообщества. Изначально школьники планировали сделать Telegram-бота, но в итоге остановились на расширении для Google Chrome.
На третьем месте — четыре школьника, которые разработали девять игр на основе технологии управления взглядом — айтрекинга. Они предназначены для людей с инвалидностью, которые не могут набирать текст на клавиатуре. Работать над задачами помогал проектный центр компании «1С» Питерской Вышки.
Приз зрительских симпатий получил Telegram-бот, который генерировал стихотворные фразы в стиле Пушкина. Основной и самой сложной задачей команды было срифмовать строки между собой: алгоритм строил предложение от последнего слова в строке. Модель сначала обучалась на корпусе стихотворений разных авторов, потом — на произведениях Пушкина. По словам участников, они тестировали бота на творчестве Пушкина и Маяковского, и результаты выдачи отличались.
Повторить мастерство поэта боту пока не удалось, но рифмы он генерирует неплохо. Вдохновившись арбузом во время обеда, ребята создали о нем такое стихотворение через Telegram:
Я люблю арбузы,
Я их люблю, как и вы.
Румяный и толстопузый,
И козы, и соловьи.
Надежда Тарубарова, 11-й класс, Курск
Когда я приехала сюда, то мало знала о машинном обучении и анализе данных. Но здесь я получила очень много новых знаний! У нас была очень дружная команда, каждый занимался своей частью проекта, и потом это все совмещалось. В целом — увлекательно. Наш бот действительно получился, как мы и сказали во время презентации, с характером. Может, не совсем в стиле Пушкина, но с его словами.
Все победители и призеры получили ценные подарки от Питерской Вышки, VK и «Тинькофф». За первое место также полагались призы от компании BIOCAD.
Школа по практическому программированию и анализу данных — традиционное мероприятие для старшеклассников. В планах — расширить онлайн-часть мероприятий с лекциями. Следить за новостями и проектами факультета можно на его сайте.
Мухин Михаил Сергеевич
Санкт-Петербургская школа физико-математических и компьютерных наук: Декан
Рогачев Александр Игоревич
Департамент анализа данных и искусственного интеллекта: Преподаватель
Свидченко Олег Анатольевич
Центр анализа данных и машинного обучения: Приглашенный преподаватель