We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis: Advanced Level

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
2 year, 1, 2 module

Instructors

Программа дисциплины

Аннотация

Данный курс является продолжением курса по анализу данных. Этот курс готовит студентов к описанию и анализу данных с использованием современных продвинутых статистических инструментов. Первый модуль посвящен теории и практике причинно-следственной связи. Темы второго модуля включают специальные случаи ограничения данных, работу с пропущенными данными, анализ выживаемости и моделирование выбора. Курс состоит из лекций\семинаров и практических занятий по каждой теме. Оценка основывается на выполнении практических заданий, двух индивидуальных проектах и итоговом экзамене
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель этого курса - дать обзор передовых статистических методов, которые используются для анализа данных. Студенты научатся использовать эти методы на практике, а также выбирать корректные методы для специфической структуры данных и аргументированно обосновывать свой выбор
Планируемые результаты обучения

Планируемые результаты обучения

  • Различает корреляцию и каузальность. Объясняет основные подходы к изучению каузальности
  • Способен разработать эксперимент для оценки эффекта воздействия
  • Владеет методами балансировки экспериментальной и контрольной групп, чтобы сделать их сопоставимыми для каузального вывода
  • Применяет квази-экспериментальные методы в анализе результатов
  • Имеет представление о DAGs и их применении в каузальном анализе
  • Идентифицирует проблемы в данных.
  • Получает робастные оценки путем корректировки смещения выборки
  • Умеет восстанавливать пропущенные значения путем множественной импутации.
  • Использует метод максимального правдоподобия и модели дискретного выбора.
  • Моделирует временного измерение в данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы причинно-следственного вывода
  • Рандомизированные эксперименты
  • Наблюдаемые данные (observational studies) и каузальный вывод
  • Квази-экспериментальные методы
  • Ненаправленные графы (directed acyclic graphs)
  • Проблемы данных: что может пойти не так?
  • Корректировка смещения выборки
  • Работа с пропущенными данными.
  • Метод максимального правдоподобия
  • Модели длительности
Элементы контроля

Элементы контроля

  • неблокирующий Проект 1
    Студенты должны продемонстрировать свои навыки применения методов причинно-следственного вывода и обосновать свой выбор метода.
  • неблокирующий Экзамен
    Экзамен проводится в форме самостоятельной домашней работы. На выполнение заданий отводится 48 часов Работы, сданные после дедлайна, штрафуются на 1 балл за каждый час просрочки
  • неблокирующий Домашние задания (практика)
    По каждой изученной теме студенты получают домашнее задание. Задание оценивается по 10-бальной шкале Срок выполнения задания - одна неделя. В случае нарушения срока штраф 1 балл за каждую неделю просрочки
  • неблокирующий Проект 2
    Проект потребует от студентов продемонстрировать навыки работы с пропущенными значениями и подходами, основанными на методе максимального правдоподобия.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 учебный год 2 модуль
    0.4 * Домашние задания (практика) + 0.2 * Проект 1 + 0.2 * Проект 2 + 0.2 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Advanced statistics in research : reading, understanding, and writing up data analysis results, Hatcher, L., 2013
  • An introduction to statistical methods and data analysis, Ott, R. L., 2001
  • Cramer D. Advanced Quantitative Data Analysis. 2003.
  • Data analysis using regression and multilevel/hierarchical models, Gelman, A., 2009
  • Horowitz, J. L. (2018). Bootstrap Methods in Econometrics. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsarx&AN=edsarx.1809.04016
  • Regression and other stories, Gelman, A., 2021
  • The book of why : the new science of cause and effect, Pearl, J., 2018

Рекомендуемая дополнительная литература

  • Aguirregabiria, V., & Carro, J. M. (2021). Identification of Average Marginal Effects in Fixed Effects Dynamic Discrete Choice Models.
  • Gelman, A., & Hill, J. (2007). Data Analysis Using Regression and Multilevel/Hierarchical Models. Cambridge University Press.

Авторы

  • Ильина Мария Ивановна
  • Иванюшина Валерия Александровна
  • Снарский Ярослав Александрович