Языковые технологии в бизнесе. Предметы
Рассказываем, чем занимаются студенты бизнес трека ОП “Языковые технологии в бизнесе и образовании”
В рамках магистерской программы “Языковых технологий” у студентов есть возможность выбрать траекторию для дальнейшего развития. Какие предметы отличают бизнес-направление образовательной программы, расскажем далее.
Глубинное обучение
Основные цели в освоении этой дисциплины — это знание базовых принципов глубокого обучения для Ahead-of-Time компилятора и умение использовать эти принципы при создании собственных систем автоматической обработки текстов.
По итогам освоения курса студент овладевает эвристиками разработки нейросетей: multi-head attention, self-attention, маскирование, сглаживание в механизме внимания, positional encoding.
Дисциплина поможет также разобраться в современной архитектуре transformer.
Магистранты научатся использовать самые востребованные сегодня предобученные модели – GPT и BERT, разберутся в устройстве сверточных сетей, их ансамблях и операциях агрегации.
По итогам курса они научатся решать задачи языкового моделирования, определять и контролировать метрики для обучения модели, использовать обученные модели для генерации текстов.
Онтологии и семантические технологии
По итогам освоения дисциплины студент получит представления о взаимосвязи онтологического инжиниринга и семантических технологий с компьютерной лингвистикой, узнает историю развития направления и овладеет современным инструментарием онтологического инжиниринга. Магистранты разберутся в классификациях онтологий и ключевых методологии их проектирования. Их ждет работа с основными способами представления знаний: фреймы, сценарии и продукции. Студенты изучат формальные языки, языки представления знаний и языка OWL, его диалекты и приложения, а также научатся отличать «информацию», «данные» и «знания», работать с семантическими сетями и лингвистическими шкалами.
Речевые технологии
В рамках этого курса студенты получат знания об основных принципах синтеза и анализа речи, научатся анализировать звуковой поток с помощью специальных программ, изучат методы синтеза речи и познакомятся с существующими ресурсами, включая звуковые корпуса разных языков.
По окончании курса студент овладевает различными методами синтеза речи (компилятивный, селективный, параметрический, статистический параметрический, артикуляционный, гибридный), навыками построения пайплайна для задач анализа речи и подготовки звуковых данных, техниками обучения с нуля и использования предобученных моделей для анализа речи.
Магистранты познакомятся с разработкой диалоговых систем и научатся решать задачи внутри этих систем. Их ждет изучение устройства и основных принципов работы систем анализа речи PRAAT, ELAN и др.
Студенты смогут использовать модели нормализации звучащего текста, применять методы фонетического и просодического анализа, использовать обученные модели для генерации звучащего текста.