• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Обработка естественного языка

2020/2021
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты
Статус:
Курс по выбору
Когда читается:
4-й курс, 2 модуль

Преподаватель

Программа дисциплины

Аннотация

Является дисциплиной по выбору. Данная дисциплина направлена на овладение навыками машинной обработки естественного языка.Понимание сложных фраз на любом языке - один из необходимых компонентов развития искусственного интеллекта. В курсе будут рассмотрены как классические лингвистические подходы к задачам NLP (анализу предложений, машинному переводу и т.д.), так и современные методы, основанные на глубинном обучении. В результате освоения дисциплины студент должен:знать основные алгоритмы NLP; уметь извлекать именованные сущности и определять тональность текста; владеть математическим аппаратом и алгоритмами морфологического анализа и машинного перевода.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Обработка естественного языка» являются формирование у студентов теоретических знаний и практических навыков по основам машинной обработки естественного языка.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеет понятиями: лемматизация, грамматические характеристики (POS-tagging), генерация. Знает: модели на основе n-грамм. Владеет понятиями: оценка вероятностей; перплексия; откат и интерполяция. Знает: лексические цепочки; скрытые марковские модели; веб-сниппеты.
  • Владеет понятиями: формализмы; контекстно-свободная грамматика; лексикализация. Имеет навык работы с классификацией; словарями. Знает: нейронные сети для анализа тональности. Владеет понятиями: WordNet; семантическая близость на основе тезауруса; векторное представление на основе нейронных сетей.
  • Владеет понятиями и имеет навык работы с поиском сущностей; базой знаний; именованными сущностями; извлечением отношений. Имеет навык работы с поиском в текстовых коллекциях. Занет подход на основе баз знаний. Владеет понятиями: взвешивание ответов; вопросно-ответные сервисы. Умеет работать с диалоговыми системами.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Морфологический анализ
    Морфологический анализ. Языковые модели. Автоматическое реферирование.
  • Синтаксический анализ
    Синтаксический анализ. Анализ тональности. Вычислительная семантика.
  • Извлечение информации
    Извлечение информации. Вопросно-ответный поиск. Диалоговые системы.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • блокирующий Устный экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.16 * Домашнее задание 1 + 0.17 * Домашнее задание 2 + 0.17 * Домашнее задание 3 + 0.5 * Устный экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778

Рекомендуемая дополнительная литература

  • Biemann, C. (2012). Structure Discovery in Natural Language. Berlin: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1299312