• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis: Advanced Level

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
2 year, 1, 2 module

Instructor

Программа дисциплины

Аннотация

Данный курс является продолжением курса по анализу данных. Этот курс готовит студентов к описанию и анализу данных с использованием современных продвинутых статистических инструментов. Первый модуль посвящен теории и практике причинно-следственной связи. Темы второго модуля включают специальные случаи ограничения данных, работу с пропущенными данными, анализ выживаемости и моделирование выбора. Курс состоит из лекций\семинаров и практических занятий по каждой теме. Оценка основывается на выполнении практических заданий, двух индивидуальных проектах и итоговом экзамене
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель этого курса - дать обзор передовых статистических методов, которые используются для анализа данных. Студенты научатся использовать эти методы на практике, а также выбирать корректные методы для специфической структуры данных и аргументированно обосновывать свой выбор
Планируемые результаты обучения

Планируемые результаты обучения

  • Различает корреляцию и каузальность. Объясняет основные подходы к изучению каузальности
  • Способен разработать эксперимент для оценки эффекта воздействия
  • Владеет методами балансировки экспериментальной и контрольной групп, чтобы сделать их сопоставимыми для каузального вывода
  • Применяет квази-экспериментальные методы в анализе результатов
  • Имеет представление о DAGs и их применении в каузальном анализе
  • Идентифицирует проблемы в данных.
  • Получает робастные оценки путем корректировки смещения выборки
  • Умеет восстанавливать пропущенные значения путем множественной импутации.
  • Использует метод максимального правдоподобия и модели дискретного выбора.
  • Моделирует временного измерение в данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы причинно-следственного вывода
  • Рандомизированные эксперименты
  • Наблюдаемые данные (observational studies) и каузальный вывод
  • Квази-экспериментальные методы
  • Ненаправленные графы (directed acyclic graphs)
  • Проблемы данных: что может пойти не так?
  • Корректировка смещения выборки
  • Работа с пропущенными данными.
  • Метод максимального правдоподобия
  • Модели длительности
Элементы контроля

Элементы контроля

  • неблокирующий Проект 1
    Студенты должны продемонстрировать свои навыки применения методов причинно-следственного вывода и обосновать свой выбор метода.
  • неблокирующий Экзамен
    Экзамен проводится в форме самостоятельной домашней работы. На выполнение заданий отводится 48 часов Работы, сданные после дедлайна, штрафуются на 1 балл за каждый час просрочки
  • неблокирующий Домашние задания (практика)
    По каждой изученной теме студенты получают домашнее задание. Задание оценивается по 10-бальной шкале Срок выполнения задания - одна неделя. В случае нарушения срока штраф 1 балл за каждую неделю просрочки
  • неблокирующий Проект 2
    Проект потребует от студентов продемонстрировать навыки работы с пропущенными значениями и подходами, основанными на методе максимального правдоподобия.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 учебный год 2 модуль
    0.4 * Домашние задания (практика) + 0.2 * Проект 1 + 0.2 * Проект 2 + 0.2 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Advanced statistics in research : reading, understanding, and writing up data analysis results, Hatcher, L., 2013
  • An introduction to statistical methods and data analysis, Ott, R. L., 2001
  • Cramer D. Advanced Quantitative Data Analysis. 2003.
  • Data analysis using regression and multilevel/hierarchical models, Gelman, A., 2009
  • Horowitz, J. L. (2018). Bootstrap Methods in Econometrics. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsarx&AN=edsarx.1809.04016
  • Regression and other stories, Gelman, A., 2021
  • The book of why : the new science of cause and effect, Pearl, J., 2018

Рекомендуемая дополнительная литература

  • Aguirregabiria, V., & Carro, J. M. (2021). Identification of Average Marginal Effects in Fixed Effects Dynamic Discrete Choice Models.
  • Gelman, A., & Hill, J. (2007). Data Analysis Using Regression and Multilevel/Hierarchical Models. Cambridge University Press.

Авторы

  • Ильина Мария Ивановна
  • Иванюшина Валерия Александровна
  • Снарский Ярослав Александрович