«Можно представить нейросети как прогулку по Невскому проспекту», — Виктория Фирсанова о преподавании, исследовательских интересах и разработке мобильного приложения
В последнее время мы много читаем и говорим об искусственном интеллекте, пробуем генерировать картинки и формулировать запросы для ChatGPT. Но что делать, когда работа с искусственным интеллектом — часть профессии? Как обучать студентов тому, что меняется каждый день? Об этом и многом другом поговорили с Викторией Фирсановой, преподавателем курсов «Основы программирования» и «Машинное обучение» на магистерской программе «Языковые технологии в бизнесе и образовании».
Квантовый скачок в знаниях: компьютер на кухне, GPT-2 и соседка по комнате
Недавно читала биографию Стива Джобса, где описана сборка первого компьютера Apple. Похожая история происходила и в моей семье. Я с детства была окружена всем, что связано с компьютерами. Мой папа был одним из тех инженеров, которые в 80-е годы собирали компьютер у себя на кухне. Но с детства меня привлекали и технологии, и изучение языков. Я выросла в Челябинске. В школьные годы ходила к преподавателю ЧелГУ: она заваривала чай, готовила пироги, цитировала мне «Евгения Онегина», а после мы обсуждали языкознание. К концу обучения я уже точно знала, что хочу изучать компьютерную лингвистику, потому что эта сфера точно отвечала моим интересам — технологиям и языкам.
Я окончила программу «Филология» в Питерской Вышке. Тогда это была довольно новая программа, отличавшаяся от классического филологического образования. У нас было много курсов по выбору. Благодаря такому конструктору, я получила именно то образование, которое хотела. В 2019 году я попала на Осеннюю школу по формальному синтаксису и формальной семантике в Московской Вышке. Нам читали лекции лучшие преподаватели, в том числе американский лингвист Барбара Парти, ученица Ноама Хомского. Во время школы я всем рассказывала, что хочу изучать компьютерную лингвистику. Тогда один из участников отправил мне ссылку на YouTube-канал Стэнфордского университета. Там были лекции Криса Мэннинга и его коллег по обработке естественного языка, где они рассказывали о компьютерной лингвистике: от основ и до самых современных нейросетей — на тот момент это были BERT и GPT-2. У меня был такой квантовый скачок в знаниях. Я до сих пор помню момент, когда впервые запустила GPT-2, начала обучать нейросети, самостоятельно нарабатывала базу и училась программировать на онлайн-курсах. Моя выпускная работа в бакалавриате уже была посвящена сверточным нейросетям для классификации. Обычно люди из гуманитарной сферы опасаются изучения математики и программирования. Но я так загорелась этим, и материал усваивался невероятно легко. Сейчас понимаю, что мой гуманитарный бэкграунд помог мне раскрыться и получить гармоничное развитие.
Для меня было важно изучать технологии не ради технологий, а понять как этот инструмент может что-то менять и быть полезным для других. Я поступила на «Компьютерную лингвистику» в магистратуру СПбГУ, где продолжала наращивать базу. Но разные вещи вроде линейной алгебры или байесовской статистики приходилось изучать самостоятельно. Выходит, что в части цифровых технологий я в большей степени самоучка. Параллельно меня интересовала инклюзия во всем ее разнообразии. Так сложилась, что на первом курсе бакалавриата я жила в студгородке в Московском районе, где моей соседкой по комнате была девушка с сильным нарушением слуха. Мы подружились, у нас сложились отличные отношения, но это был не самый простой опыт. Тогда я поняла, что, с одной стороны, инклюзия развивается достаточно активно, но с другой — не хватает ресурсов для того, чтобы люди были качественно информированы и активнее включались в этот процесс. Так возник исследовательский интерес к теме, которой я занимаюсь до сих пор. В магистратуре я разрабатывала системы, помогающие развивать коммуникативные навыки у людей с расстройствами аутистического спектра. Эту тему мне подсказала мама. Она журналист и пишет о вопросах здравоохранения, инклюзивной среды и других подобных сферах. Тогда же я победила в конкурсе и получила стипендию Фонда Владимира Потанина. Это был ненаучный грант на благотворительную разработку.
Инструмент в руках: EMPI, нейросети и новые профессии
Сейчас, в аспирантуре, я продолжаю развивать этот проект и создаю мобильное приложение EMPI — социальную сеть для инклюзивной среды, где все строится на руководстве по обеспечению доступности веб-контента, а в основе лежат безопасность, психологический комфорт пользователей, которым доступность жизненно необходима. Это универсальное мобильное приложение, которое поможет поддерживать тьюторов, психиатров, ребят с особенностями и их родителей, нейротипичных людей. Проект сейчас на стадии прототипа: есть наборы данных, которые будут обеспечивать работу нейросетей, отрисовка в Figma. В данный момент я работаю над нейросетевой архитектурой, которая будет использоваться в приложении, но цельной системы пока нет. Технологии развиваются быстро, но я считаю, что лучше проверять работу на небольших масштабах прежде, чем ее внедрить. Параллельно выступаю на мероприятиях, где рассказываю о приложении благотворительным организациям и получаю консультации различных НКО: участвовала в «Днях инклюзии» от МГЛУ, недавно выступала в «Нормальном месте», где проходило мероприятие, посвященное проблемам аутизма.
В области науки я занимаюсь генеративным искусственным интеллектом. Изучаю, как работают большие языковые модели, например, модный сейчас ChatGPT. Разрабатываю собственный фреймворк: создаю набор готовых решений, чтобы сделать такие модели безопасными, информативными и доступными для людей с особенностями здоровья. В своем телеграм–канале «EMPI AI» я рассказываю о наработках, публикую промежуточные результаты. Это помогает мотивировать себя и продолжать работу над проектом. На первых этапах иногда бывает психологически трудно, особенно когда используешь новые технологии, которые приносят за собой новые проблемы. Нужно изучать, как правильно ими пользоваться и какие риски существуют. Многие люди относятся к искусственному интеллекту как к волшебству, забывая или не зная, что это главным образом алгоритм, у которого есть свои ограничения.
Часто говорят, что из-за искусственного интеллекта исчезнут многие профессии, но не все понимают, что появятся новые. Возможно, даже в большем количестве. Существует множество программ машинного перевода, не только Google Translate. Исчезли ли переводчики? Нет, изменилось качество самой профессии. Людям по-прежнему необходимо быть умнее нейросети, быть экспертом. Нейросеть — это просто модель, делающая предсказания, точность которых нужно проверять. Реальность безгранична, и даже самые мощные суперкомпьютеры не могут смоделировать все. Какой бы продвинутой ни была нейросеть — это по-прежнему инструмент в руках специалиста. Технологии не заменяют человека, а дают ему дополнительные возможности. В этом случае от нас требуется только развивать новые умения — тогда нейросети станут действительно настоящей находкой и помощником.
Думать как программист: студенты, интерес к дисциплинам и ответственность
У каждого из нас собственное восприятие реальности, следовательно, разное восприятие материала. Кому-то нравится математическая нотация, другим — представление информации в виде блок-схем, третьим помогают метафоры. Например, представить нейросети как прогулку по Невскому проспекту тоже можно. Но важно давать прикладной материал, который получится применить в реальной жизни и сразу объяснять, зачем это все использовать: разбирать конкретную структуру HTML-файла, взять настоящую базу данных и прочее. Когда в учебной дисциплине появляется целенаправленность, она становится интересной. Но я всегда стараюсь начинать с себя. Если хочешь заинтересовать других, сделай так, чтобы это было интересно тебе. Но важнее всего, на мой взгляд, эмпатия. Ее стоит использовать как инструмент для налаживания связи со своими студентами. Когда входишь в аудиторию, начинаешь анализировать, чувствовать, как ребята реагируют на материал, насколько им это отзывается.
У курса «Основы программирования» нет входного порога. Я стараюсь выстраивать занятие такие образом, чтобы было интересно студентам с разным уровнем подготовки: и тем, кто знаком с Python, и ребятам, которые никогда не занимались программированием. Это одновременно и практическая, и теоретическая дисциплина. Я уделяю достаточное внимание тому, как устроен код. Важно понимать алгоритм его работы и думать как программист, а не копировать чужой код со Stack Overflow. Но для того, чтобы научиться программировать, нужна постоянная практика. В этом вопросе я уделяю отдельное внимание психологически комфортным заданиям — подбираю темы, которые интересны студентам, ориентируюсь на их предпочтения. Например, я проводила большой практикум с кинематографической базой IMDb. Еще я не боюсь давать ссылки на новые фильмы, мемы и прочие вещи, которые помогают разнообразить материал и добавить легкость. Работу я сопровождаю виртуальным учебником на GitHub: веду репозиторий, где публикую задания, шпаргалки, куда ребята могут подсматривать, если что-то забыли. Все помнить невозможно, поэтому я призываю магистрантов учиться пользоваться документацией и Stack Overflow, поощряю, если они разумно используют ChatGPT. Я всегда рада проконсультировать и помочь. На первом занятии даю ребятам свои контакты, чтобы они в любой момент могли со мной связаться, если вдруг что-то будет непонятно или потребуются дополнительные объяснения.
В будущем учебном году я буду преподавать курс «Машинное обучение». Это довольно широкая тема, но так как мы обучаем компьютерной лингвистике, и сама я эксперт именно в этом, то в рамках дисциплины мы будем рассматривать машинное обучение, концентрируясь на обработке естественного языка. Пойдем последовательно, и я постараюсь дать все основы. Мы рассмотрим, как устроены нейросети и нейрон, выясним, что такое «функции активации», «градиентный спуск» и прочие страшные слова при помощи визуала, блок-схем. Разберемся, как это все взаимодействует, имеет ли отношение искусственный нейрон к мозгу человека — и многое другое. К венцу творения — ChatGPT — мы тоже перейдем, но перед этим посмотрим, что стоит за построением векторов слов, какие модели можно использовать для классификации текстов — и уже потом перейдем к диалоговым моделям.
Главная трудность в преподавании для меня — собственные пробелы в знаниях. Мы люди, и знать все невозможно. Но когда ты преподаватель, то несешь ответственность за материал, который даешь студентам. Я не берусь преподавать то, чего не знаю, но считаю важным перечитывать учебники и восполнять пробелы. Каждый раз я по-новому смотрю на материал. Во-первых, потому что рассказываю о новых технологиях, которые появляются каждый день — и здесь важна актуальность данных. Во-вторых, я для себя самый главный критик. Уже сейчас пересматриваю и перерабатываю материал, который давала студентам в прошлом году, а находить время для качественной подготовки очень важно.
Вокруг умные люди: популярная культура, спортивная злость и Филип Дик
Две вещи, которые помогают мне не терять интерес к тому, чем я занимаюсь — спорт и спортивная злость. Объясню второе: я подписана на множество рассылок об IT, читаю в соцсетях и мессенджерах, что пишут коллеги, хожу на разные митапы, общаюсь. В такие моменты ты видишь, что вокруг тебя умные люди. Это злит в хорошем смысле слова. Кто-то уже успел протестировать новую GPT-4о, а я нет? Нужно это исправить! Общаться с такими же заряженными людьми очень помогает.
Научная фантастика для меня — главный источник вдохновения: Айзек Азимов, братья Стругацкие. Прямо сейчас я читаю Филипа Дика. Его книги точно понравятся тем, кто хочет загореться высокими технологиями будущего. Еще я обожаю англоязычный подкаст Gadget Lab, где рассказывают о новых девайсах, а в конце дают различные нетехнические рекомендации. В популярной культуре тоже много вдохновляющего. Например, для меня в свое время большим толчком стал фильм «Матрица». Романтизация технологий по-своему мотивирует и даже помогает с идеями для разработки. Несмотря на то, что академическая среда и высокая культура очень важны, интерес к популярной культуре не только полезен в качестве разрядки, но и очень помогает в научных исследованиях. Например, недавно я попробовала писать музыку с помощью генератора голоса Grimes, потому что услышала о прецеденте, связанном с искусственным интеллектом. После пошла искать научные статьи о генерации музыки. Иногда от популярной культуры к академической среде ведет очень короткая дорожка.
Фирсанова Виктория Игоревна
Департамент филологии: Приглашенный преподаватель