• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Computational Linguistics

2019/2020
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Elective course
When:
4 year, 1, 2 module

Instructor

Программа дисциплины

Аннотация

Курс предполагает знакомство студентов с основными направлениями и методами компьютерной лингвистики, формированию у них практических навыков работы с лингвистическими ресурсами и программами компьютерного анализа текстов, построение собственного корпуса текстов или лингвистической базы данных и проведение лингвистического исследования с использованием компьютерных средств. Курс предназначен для студентов-филологов и не требует специальной компьютерной подготовки или навыков программирования. Предлагаемый курс будет полезен не только студентам лингвистического направления, но и студентам-литературоведам, поскольку синтез традиционного и компьютерного подхода в филологических исследованиях является весьма перспективным.
Цель освоения дисциплины

Цель освоения дисциплины

  • Получение студентами знания об основных методах и направлениях развития компьютерной лингвистики.
  • Приобретение студентами навыков адекватного пользование основными программными продуктами, необходимыми при работе с текстами и корпусами текстов, и навыков создания собственных корпусов текстов для решения локальных научных и академических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент имеет представление об основных задачах и приложениях компьютерной лингвистики.
  • Студент знает программы по автоматической обработке текстов на лексическом и морфологическом уровнях и умеет ими пользоваться
  • Студент знает программы по автоматической обработке текстов на синтаксическом, семантическом и прагматическом уровнях и умеет ими пользоваться.
  • Студент знаком с основами статистического анализа, методами и подходами квантитативной лингвистики
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основные задачи, основания и приложения компьютерной лингвистики
    Математические и лингвистические основания компьютерной лингвистики. Основные понятия компьютерной лингвистики. Компьютерная лингвистика в контексте смежных дисциплин — общей лингвистики, компьютерной лингвистики, квантитативной лингвистики, корпусной лингвистики, цифровой гуманитаристики и др. Компьютерные, корпусные и информационные технологии для лингвистов и литературоведов. Онлайн ресурсы для филологов.
  • Возможности и программы автоматической обработки текстов на лексическом и морфологическом уровнях
    Построение частотных словарей. Программы для лексикографической работы, лемматизация, морфологическая разметка, построение конкордансов и др.
  • Возможности и программы автоматической обработки текстов на синтаксическом, семантическом и прагматическом уровнях
    Компьютерный синтаксис. Компьютерное представление значений. Анализ прагматического аспекта.
  • Основы статистики. Элементы квантитативной лингвистики
    Основные понятия и методы статистического анализа лингвистических данных. Дескриптивные статистики, проверка гипотез. Программы статистической обработки данных. Введение в стилеметрический анализ. Задачи атрибуции.
Элементы контроля

Элементы контроля

  • неблокирующий Презентация
    Устная презентация со слайдами PowerPoint готовится дома и должна отражать возможности и ограничения одной из современных компьютерных программ обработки лингвистических данных или программы, предназначенной для построения лингвистических теоретических моделей. Презентация, текст которой полностью заимствован из печатного или Интернет-источника и никак критически не переработан студентом, оценивается в 0 баллов.
  • неблокирующий Практическая работа №1
    Постройте частотные словари для двух предложенных текстов. Сопоставьте состав и относительные частоты 25 наиболее употребительных слов.
  • неблокирующий Домашнее задание
    Цель домашнего задания — получить навык работы с синтаксической разметкой, проверить качество синтаксической разметки программой ЭТАП-4 и программы ее визуализации (синтаксических схем предложения). Выполняется письменно. Направляется студентам по электронной почте. Студенты направляют ответ преподавателю также по электронной почте.
  • неблокирующий Практическая работа № 2
    Краткая самостоятельная практическая работа на проверку владением основными статистическими понятиями и умением просчитывать их в MS Excel. Выполняется аудиторно. Время выполнения 20 минут, результат присылается в виде файла Excel по электронной почте не позднее времени окончания занятия. Таблица для анализа посылается студентам по электронной почте непосредственно перед проведением работы.
  • неблокирующий Контрольная работа
    Выполняется письменно вне аудитории. Задачей итоговой контрольной работы — проверка того, как 1) студенты используют компьютерные программы обработки текста и 2) в какой мере студенты могут использовать статистические методы в лингвистических исследованиях.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.2 * Домашнее задание + 0.3 * Контрольная работа + 0.2 * Практическая работа № 2 + 0.2 * Практическая работа №1 + 0.1 * Презентация
Список литературы

Список литературы

Рекомендуемая основная литература

  • Davies, A., & Elder, C. (2004). The Handbook of Applied Linguistics. Malden, MA: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=108713
  • Lappin, S., Fox, C., & Clark, A. (2010). The Handbook of Computational Linguistics and Natural Language Processing. Chichester, West Sussex: Wiley-Blackwell. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=330500

Рекомендуемая дополнительная литература

  • Baker, P., Hardie, A., & McEnery, T. (2006). A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=169612