We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Natural Language Processing

2022/2023
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Delivered at:
Department of Informatics
Course type:
Elective course
When:
4 year, 3 module

Instructor

Программа дисциплины

Аннотация

Является дисциплиной по выбору. Данная дисциплина направлена на овладение навыками машинной обработки естественного языка. Понимание сложных фраз на любом языке - один из необходимых компонентов развития искусственного интеллекта. В курсе будут рассмотрены как классические лингвистические подходы к задачам NLP (анализу предложений, машинному переводу и т.д.), так и современные методы, основанные на глубинном обучении. Для освоения дисциплины студентам необходимы знания, полученные в результате изучения дисциплины «Глубинное обучение».
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов теоретических знаний и практических навыков по основам машинной обработки естественного языка.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает основные алгоритмы NLP
  • Умеет извлекать именованные сущности и определять тональность текста
  • Имеет навыки применения математического аппарата и алгоритмов морфологического анализа и машинного перевода
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Морфологический анализ
  • Раздел 2. Синтаксический анализ
  • Раздел 3. Извлечение информации
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание №1
    Домашнее задание №1 выдается студентам в одном варианте и состоит из 3 задач. Срок выполнения домашнего задания - 4 недели. Форма представления обучающимися домашнего задания - реализованный на любом языке программирования алгоритм.
  • неблокирующий Домашнее задание №2
    Домашнее задание №2 выдается студентам в одном варианте и состоит из 3 задач. Срок выполнения домашнего задания - 4 недели. Форма представления обучающимися домашнего задания - реализованный на любом языке программирования алгоритм.
  • неблокирующий Домашнее задание №3
    Домашнее задание №3 выдается студентам в одном варианте и состоит из 3 задач. Срок выполнения домашнего задания - 4 недели. Форма представления обучающимися домашнего задания - реализованный на любом языке программирования алгоритм.
  • блокирующий Устный экзамен
    Устный экзамен проводится в форме ответов на вопросы экзаменационного билета. Экзаменационный билет содержит два вопроса из перечня вопросов к экзамену. Возможны дополнительные вопросы, в случае если экзаменуемый в недостаточной степени подробно ответил на вопросы билета. На подготовку ответа выделяется 2,5 часа.
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 3 модуль
    Преподаватель учитывает оценку за текущий контроль (домашние задания). Онакопленная = (Од/з1 + Од/з2 + Од/з3) / 3 Результирующая оценка за дисциплину рассчитывается следующим образом: ОРезультирующая = 0,79 Онакопленная + 0,21 Оэкзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778

Рекомендуемая дополнительная литература

  • Biemann, C. (2012). Structure Discovery in Natural Language. Berlin: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1299312

Авторы

  • Спицина Кристина Станиславовна
  • Кузнецов Антон Михайлович