• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Студенты Питерской Вышки разработали чат-бот для изучения хантыйского языка

В Бурятии прошла первая Международная летняя лингвистическая школа «Этнокультурно-языковое пространство трансграничья: история и современность». Питерскую Вышку представляла студентка магистратуры «Языковые технологии в бизнесе и образовании» Елена Сатвалова. Она презентовала Моњщәӈ —  виртуального ассистента для обучения хантыйскому языку с нуля.

Студенты Питерской Вышки разработали чат-бот для изучения хантыйского языка

Фото предоставлено Еленой Сатваловой

Летняя школа была посвящена исследованию актуальных направлений современной лингвистики, а также языковых и этнокультурных процессов трансграничья Востока. В рамках мероприятия проводились лекции, мастер-классы, круглые столы и тематические дискуссии. Участниками стали более 80 ученых из Турции, Таджикистана, Монголии, Китая и разных регионов России.

Студентка 1-го курса магистерской программы «Языковые технологии в бизнесе и образовании» Елена Сатвалова презентовала виртуального помощника для изучения казымского диалекта хантыйского языка. В основе методологии — интерактивные упражнения по мотивам сказочных текстов. Моњщәӈ бот — совместный проект НИУ ВШЭ — Санкт-Петербург и Обско-угорского института прикладных исследований и разработок. Его реализацией занималась команда первокурсниц магистратуры Питерской Вышки: Алина Андреева, Елена Сатвалова и Анна Сугян под кураторством академического руководителя Анастасии Колмогоровой.

Анастасия Колмогорова, академический руководитель магистерской программы «Языковые технологии в бизнесе и образовании»

У нас дружеские связи с Обско-угорским институтом. Они занимаются сбором, изучением и сохранением фольклора. Коллеги обратились к нам с просьбой разработать современный продукт, направленный на ревитализацию хантыйского языка. На первой стадии мы обрабатывали и загружали материалы. Затем команда провела тематическое моделирование и создала перечень тегов. Кроме того, мы оформили интерфейс в национальной символике.

«Школа мне понравилась, это первый подобный опыт. Я выступала с докладами в двух секциях, а наш проект получил живой отклик у аудитории. Организаторы сделали насыщенную культурную программу, мы ездили на экскурсию в Иволгинский дацан, Баргузинскую долину и на Чивыркуйский залив.

Я непосредственно писала код и формировала структуру бота, вносила изменения и так далее. Мне очень пригодились знания с курса «Основы программирования», который ведет Виктория Фирсанова. Она консультировала и давала советы. Из необычного — добавление в программу аудиофайлов и сказок», — рассказывает Елена Сатвалова.

«Мне как лингвисту и армянке всегда была близка тема сохранения и передачи национального языка следующим поколениям. Я поддерживала коммуникацию с коллегами из Обско-угорского института прикладных исследований и разработок, а также собирала данные: двуязычные тексты, информацию из словарей, тестовые задания.

Самое сложное было в построении пользовательского маршрута. Мы долго думали над сценарием бота, чтобы сделать его наиболее эффективным и интересным. Мне очень помогли вышкинские курсы «Проектно-исследовательский семинар» и «Семинар наставника». Сейчас продукт гибкий и может быть полезен как носителям языка, так и тем, кто только начинает свой путь в его изучении», — отмечает Анна Сугян.

«Я знала о вышкинских проектах по изучению малых языков России еще при поступлении. Ведь я сама из Якутии, и когда появился шанс присоединиться к команде, то воспользовалась этой возможностью. Всегда любопытно погрузиться в неизвестную культурную среду.

Мне больше всего понравилось заниматься лексическим разделом нашего продукта. Здесь нужно быть усидчивым и внимательным, постоянно себя перепроверять. Долгие поиски нужного слова и его перевода могут сильно утомить, но для меня это безумно увлекательно. Я чувствую себя детективом или археологом, разгадывающим многочисленные загадки», — рассказывает Алина Андреева.

Сейчас проект находится на стадии MVP перед релизом, пользователям доступны 19 сказок с аудиовизуальными данными и заданиями. Разработчики планируют добавить отслеживание учебного прогресса и расширить коллекцию.

«На сегодняшний день «языковое гнездо» является признанным во всем мире эффективным способом возрождения языка. Этот способ предполагает дошкольное обучение детей по принципу раннего полного языкового погружения. Наш проект имеет и социальную, и исследовательскую ценность. Бот будет востребован в городах, селах, детских садах, коренных поселениях и так далее. Мы постарались соединить языковые традиции, образование и цифровизацию», — подчеркнула  Анастасия Колмогорова.

Магистерская программа «Языковые технологии в бизнесе и образовании» готовит специалистов, владеющих двумя взаимодополняющими компетенциями: базовые лингвистические знания и продвинутые навыки в области автоматического анализа естественного языка. Студенты изучают лингвистическую теорию и компьютерную обработку текстов, математические основы лингвистического анализа и программирования.