We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Compulsory course
When:
3 year, 2 module

Instructor


Kirina, Margarita

Программа дисциплины

Аннотация

Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных специально для студентов образовательной программы «Филология» и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)»
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимать и корректно использовать основные статистические понятия
  • Фильтровать данные по нескольким условиям
  • Создавать сводные таблицы
  • Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
  • Использовать продвинутые методы визуализации данных, использовать различные диаграммы
  • Переводить значения признака в z-оценки
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в инструменты
  • Введение в статистику. Базовые манипуляции с данными
  • Типы данных. Создание новых переменных
  • Генеральная совокупность и выборка. Частотные таблицы и распределения
  • Описательные статистики: меры центральной тенденции и разброса
  • Z-оценка. Выбросы.
  • Корреляция
  • Введение в визуализацию данных
  • Продвинутая визуализация данных
  • Линейная регрессия
Элементы контроля

Элементы контроля

  • неблокирующий Работа на семинарах
    Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Совмещенный элемент контроля. Оценивается по 10-балльной шкале.
  • неблокирующий Самостоятельные работы
    20-минутные тесты, проводимые на семинарах по пройденному материалу онлайн-курса. Каждый тест оценивается по 10-балльной шкале, в итоговую оценку идет среднее всех тестов. Множественное задание: состоит из 5 оцениваемых заданий. Синхронный элемент контроля.
  • неблокирующий Экзамен
    Контрольная, основанная на Спецификации НЭ по Анализу данных 2024-25 года начального уровня. Оценивается по 10-балльной шкале. Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по анализу данных (https://edu.hse.ru/course/view.php?id=136231) Подлежит обязательной пересдаче при ликвидации академической задолженности. Синхронный элемент контроля.
  • неблокирующий Домашнее задание
    Домашнее задание представляет собой проведение разведочного анализа и составление дашборда на основе предложенного (или выбранного самостоятельно) набора данных. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Асинхронный элемент контроля. Оценивается по 10-балльной шкале.
  • неблокирующий Исследовательский проект
    Выполняется в группах из 3-4 человек и представляет собой самостоятельный анализ и интерпретацию полученных результатов на выбранных данных поэтапно. Возможно выполнение проекта по одному из тематических направдлений: 1) Анализ данных в Excel + продвинутая визуализация. 2) Использование NLP-инструментов (Python/R) для решения задачи компьютерного анализа текстов. 3) Использование Gephi / stylo для анализа корпусов текстов. Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания. Совмещенный элемент контроля. Оценивается по 10-балльной шкале.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.15 * Домашнее задание + 0.3 * Исследовательский проект + 0.2 * Работа на семинарах + 0.2 * Самостоятельные работы + 0.15 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014

Авторы

  • Кирина Маргарита Александровна