We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Natural Language Processing

2020/2021
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Delivered at:
Department of Informatics
Course type:
Elective course
When:
4 year, 2 module

Instructor


Фитц Сергей Юрьевич

Программа дисциплины

Аннотация

Является дисциплиной по выбору. Данная дисциплина направлена на овладение навыками машинной обработки естественного языка.Понимание сложных фраз на любом языке - один из необходимых компонентов развития искусственного интеллекта. В курсе будут рассмотрены как классические лингвистические подходы к задачам NLP (анализу предложений, машинному переводу и т.д.), так и современные методы, основанные на глубинном обучении. В результате освоения дисциплины студент должен:знать основные алгоритмы NLP; уметь извлекать именованные сущности и определять тональность текста; владеть математическим аппаратом и алгоритмами морфологического анализа и машинного перевода.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Обработка естественного языка» являются формирование у студентов теоретических знаний и практических навыков по основам машинной обработки естественного языка.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеет понятиями: лемматизация, грамматические характеристики (POS-tagging), генерация. Знает: модели на основе n-грамм. Владеет понятиями: оценка вероятностей; перплексия; откат и интерполяция. Знает: лексические цепочки; скрытые марковские модели; веб-сниппеты.
  • Владеет понятиями: формализмы; контекстно-свободная грамматика; лексикализация. Имеет навык работы с классификацией; словарями. Знает: нейронные сети для анализа тональности. Владеет понятиями: WordNet; семантическая близость на основе тезауруса; векторное представление на основе нейронных сетей.
  • Владеет понятиями и имеет навык работы с поиском сущностей; базой знаний; именованными сущностями; извлечением отношений. Имеет навык работы с поиском в текстовых коллекциях. Занет подход на основе баз знаний. Владеет понятиями: взвешивание ответов; вопросно-ответные сервисы. Умеет работать с диалоговыми системами.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Морфологический анализ
    Морфологический анализ. Языковые модели. Автоматическое реферирование.
  • Синтаксический анализ
    Синтаксический анализ. Анализ тональности. Вычислительная семантика.
  • Извлечение информации
    Извлечение информации. Вопросно-ответный поиск. Диалоговые системы.
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • блокирующий Устный экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.16 * Домашнее задание 1 + 0.17 * Домашнее задание 2 + 0.17 * Домашнее задание 3 + 0.5 * Устный экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778

Рекомендуемая дополнительная литература

  • Biemann, C. (2012). Structure Discovery in Natural Language. Berlin: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1299312