We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Applied Linguistics

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
1 year, 3, 4 module

Instructor

Программа дисциплины

Аннотация

Целью дисциплины является знакомство студентов с основными компонентами и основными направлениями специальности (машинный перевод, информационный поиск, извлечение информации, диалоговые системы, анализ тональностей, квантитативная лингвистика и др.). В результате освоения дисциплины студенты получат базовое представление об основных направлениях современной прикладной лингвистики.
Цель освоения дисциплины

Цель освоения дисциплины

  • Сформировать представления о различных способах работы с данными.
  • Ознакомить с методами визуализации результатов анализа датасетов.
  • Развить умение писать программы с использованием методов статистического, кластерного и регрессионного анализа.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент создает пуассоновскую регрессию, позволяющую предсказывать результаты показателя X на основе имеющихся данных показателя Y.
  • Студент применяет PCA CA, MCA, MDS, t-SNE для анализа различных датасетов и уменьшения размерности данных.
  • Студент применяет методы визуализации сетевых данных c помощью пакетов, ggiraph
  • Студент применяет трансформации данных: tidyverse, dplyr; освоит работу со строками и текстами: tidytext, udpipe; сможет осуществлять сбор данных из интернета: rvest. OCR.
  • Студент производит вычисления, применяя знания по описательной и симуляционной статистике, z-преобразованию, используя пакет анализа RLing
  • Студент анализирует данные путём применения инструментов, время, карты, OCR.
  • Студент освоит работу с базовыми объектами языка R, функциями, пакетами, а также научится создавать собственные функции и циклы.
  • Студент применяет методы визуализации сетевых данных c помощью пакетов ggplot и ggplot2
  • Студент решает задачи по программированию, демонстрируя умение анализировать строки тексты и весь текст с помощью пакета ling
  • Студент способен создавать метрики расстояний, k-means, иерархические кластеризации, визуализации деревьев.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы R
  • Трансформация данных
  • Визуализация и представление данных
  • Работа со строками и текстом
  • Необычные источники данных: время, карты, OCR
  • Основы статистики
  • Регрессионный анализ
  • Кластеризация
  • Методы уменьшения размерности кластеров
  • Сетевой анализ
Элементы контроля

Элементы контроля

  • неблокирующий Самостоятельная работа
    В течение курса студенты выполняют 7 домашних работ, которые обсуждаются на занятии, после обсуждения могут быть доработаны и представлены для оценивания. В домашней работе студенту предлагается решить локальную исследовательскую задачу, использовав обсуждавшиеся в лекции методы и инструментарий.
  • неблокирующий Экзамен
    Экзамен проводится в устной форме: студент отвечает на один из проблематизирующих вопросов из заранее предоставленного для подготовки списка.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.35 * Самостоятельная работа + 0.35 * Самостоятельная работа + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Stowell, S. (2014). Using R for Statistics. Berkeley, CA: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1174344

Рекомендуемая дополнительная литература

  • Toomey, D. (2014). R for Data Science. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=933765

Авторы

  • Колмогорова Анастасия Владимировна
  • Кессель Ксения Витальевна