• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Computational Linguistics

2020/2021
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Elective course
When:
4 year, 1, 2 module

Instructors


Klimov, Aleksandr

Программа дисциплины

Аннотация

Курс предполагает знакомство студентов с основными направлениями и методами компьютерной лингвистики, формированию у них практических навыков работы с лингвистическими ресурсами и программами компьютерного анализа текстов, построение собственного корпуса текстов или лингвистической базы данных и проведение лингвистического исследования с использованием компьютерных средств. Курс предназначен для студентов-филологов и не требует специальной компьютерной подготовки или навыков программирования. Предлагаемый курс будет полезен не только студентам лингвистического направления, но и студентам-литературоведам, поскольку синтез традиционного и компьютерного подхода в филологических исследованиях является весьма перспективным.
Цель освоения дисциплины

Цель освоения дисциплины

  • Получение студентами знания об основных методах и направлениях развития компьютерной лингвистики.
  • Приобретение студентами навыков адекватного пользование основными программными продуктами, необходимыми при работе с текстами и корпусами текстов, и навыков создания собственных корпусов текстов для решения локальных научных и академических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент имеет представление об основных задачах и приложениях компьютерной лингвистики.
  • Студент знает программы по автоматической обработке текстов на лексическом и морфологическом уровнях и умеет ими пользоваться
  • Студент знает программы по автоматической обработке текстов на синтаксическом, семантическом и прагматическом уровнях и умеет ими пользоваться.
  • Студент знает базовые принципы работы с мультимедийным контентом
  • Студент знаком с основами статистического анализа, методами и подходами квантитативной лингвистики
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основные задачи, основания и приложения компьютерной лингвистики
    Математические и лингвистические основания компьютерной лингвистики. Основные понятия компьютерной лингвистики. Компьютерная лингвистика в контексте смежных дисциплин — общей лингвистики, компьютерной лингвистики, квантитативной лингвистики, корпусной лингвистики, цифровой гуманитаристики и др. Компьютерные, корпусные и информационные технологии для лингвистов и литературоведов. Онлайн ресурсы для филологов.
  • Возможности и программы автоматической обработки текстов на лексическом и морфологическом уровнях
    Построение частотных словарей. Программы для лексикографической работы, лемматизация, морфологическая разметка, построение конкордансов и др.
  • Возможности и программы автоматической обработки текстов на синтаксическом, семантическом и прагматическом уровнях
    Компьютерный синтаксис. Компьютерное представление значений. Анализ прагматического аспекта.
  • Возможности аннотирования и автоматического анализа мультимедийного контента (аудио- и видеозаписей)
    Программы инструментального анализа речи. Подходы к распознаванию и синтезу речи
  • Основы статистики. Элементы квантитативной лингвистики
    Основные понятия и методы статистического анализа лингвистических данных. Дескриптивные статистики, проверка гипотез. Программы статистической обработки данных. Введение в стилеметрический анализ. Задачи атрибуции.
Элементы контроля

Элементы контроля

  • неблокирующий Презентация
    Презентация не должна занимать более 7-10 минут и должна быть основана на собственных наблюдениях студента в рамках темы семинара. В конце презентации студент должен сформулировать один или два вопроса для дальнейшего обсуждения, обращенные к слушателям. По своему усмотрению студент может сопровождать устную презентацию слайдами PowerPoint или раздаточным материалом. Презентация, текст которой полностью заимствован из печатного или Интернет-источника и никак критически не переработан студентом, оценивается в 0 баллов.
  • неблокирующий Практическая работа №1
    Постройте частотные словари для двух предложенных текстов. Сопоставьте состав и относительные частоты 25 наиболее употребительных слов.
  • неблокирующий Домашнее задание
    Выполняется письменно, не разбивается на варианты и состоит из небольших упражнений, проверяющих усвоение материала лекций и семинаров. Направляется студентам по электронной почте в течение модуля. Студенты направляют ответ преподавателю также по электронной почте. Преподаватель дает обратную связь студентам на следующем семинаре, разбирая основные ошибки.
  • неблокирующий Практическая работа №2
    Выполните автоматический синтаксический парсинг заданных текстов с помощью разных утилит синтаксического анализа. Сопоставьте полученные результаты. Выполните с применением автоматических методов сравнение двух текстов с точки зрения используемых в них лексических средств.
  • неблокирующий Контрольная работа
    Выполняется письменно в аудитории без вариантов. Задания для контрольной работы разработаны на основе пройденного материала.. Во время написания работы разрешается пользоваться только указанными в варианте источниками.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.2 * Домашнее задание + 0.3 * Контрольная работа + 0.2 * Практическая работа №1 + 0.2 * Практическая работа №2 + 0.1 * Презентация
Список литературы

Список литературы

Рекомендуемая основная литература

  • Davies, A., & Elder, C. (2004). The Handbook of Applied Linguistics. Malden, MA: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=108713
  • Lappin, S., Fox, C., & Clark, A. (2010). The Handbook of Computational Linguistics and Natural Language Processing. Chichester, West Sussex: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=330500

Рекомендуемая дополнительная литература

  • Baker, P., Hardie, A., & McEnery, T. (2006). A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=169612