• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Политология и мировая политика»

29
Январь

Количественные методы в политических исследованиях

2018/2019
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты
Статус:
Курс по выбору
Когда читается:
2-й курс, 3, 4 модуль

Преподаватель


Турченко Михаил Сергеевич

Программа дисциплины

Аннотация

Настоящая дисциплина относится к блоку дисциплин «Базовая профильная часть». Изучение данной дисциплины базируется на следующих дисциплинах:  Математика и статистика;  Сравнительная политика;  Научно-исследовательский семинар (первый и второй годы обучения).
Цель освоения дисциплины

Цель освоения дисциплины

  • формирование у студентов представления о познавательных возможностях количественных методов анализа данных в политологических исследованиях
  • приобретение студентами знаний, умений и навыков, необходимых для сбора количественных данных и их визуализации; сравнения различных наборов данных при помощи статистических тестов; изучения взаимосвязей внутри количественных данных с помощью базовых статистических инструментов
  • приобретение студентами навыков, необходимых для работы со специализированными статистическими программами, в частности, со статистической средой R
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент демонстрирует способность использовать подходящие методы для извлечения, сбора, обобщения, тестирования и анализа статистических данных
  • Студент демонстрирует способность искать и собирать данные, а также соотносит качество и содержание данных со стоящими перед ним исследовательскими целями
  • Студент демонстрирует способность анализировать и понимать суть научных исследований, в которых используются количественные методы
  • Студент соотносит методы количественного анализа с типом и характеристиками располагаемых им данных
  • Студент умеет собирать, систематизировать и оценивать данные; сохранять результаты анализа данных: скрипты, диаграммы, таблицы
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в дисциплину. Основы работы с R
    Лекция 1. Введение в содержание курса: формы текущего и итогового контроля знаний, порядок формирования накопленной и результирующей оценок. Обзор основной литературы по курсу. Место количественных методов в современных политологических исследованиях. Лекция 2. Специализированные статистические программы: виды, примеры, плюсы и минусы разных программ. Алгоритм установки и запуска статистической среды R и R-Studio. Обзор интерфейса статистической среды R и R-Studio. Основные команды, объекты и функции в R. Семинар 1. Запуск R-Studio. Обзор интерфейса R-Studio. R как калькулятор. Загрузка и запуск статистических пакетов. Сохранение результатов работы. Открытие сохраненных скриптов. Выход из программы. Семинар 2. Объекты и функции в R. Оператор присваивания. Способы ввода данных в R: функция c(). Подготовка данных к импорту в R из Excel: функция read.csv(), а также read_excel() из пакета readxl. Импорт данных в R из других статистических программ: пакет foreign и функции read.spss(), read.dta() и др. Работа с загруженными данными: функции attach() и detach(), команда $, извлечение отдельных данных из массива. Создание таблиц и работа с ними.
  • Основные статистические понятия и введение в описательную статистику
    Лекция 3. Генеральная совокупность и выборка. Типы данных. Описательная статистика: меры центральной тенденции и меры разброса. Нормальное распределение и центральная предельная теорема. Семинар 3. Способы расчета описательной статистики в R. Работа с данными из конкретного политологического исследования.
  • Визуализация данных: принципы, инструменты, примеры
    Лекция 4. Роль визуализации данных в представлении результатов научного исследования. Принципы визуализации данных. Типы диаграмм: диаграмма рассеяния, диаграмма распределения (гистограмма), диаграмма размахов (боксплот), скрипичная диаграмма, столбчатая диаграмма, круговая диаграмма. Примеры диаграмм из политологических исследований. Семинары 4-5. Рассмотрение функций для создания различных типов диаграмм: plot(), hist(), boxplot(), vioplot(), barplot(), pie(). Рассмотрение функций для корректировки параметров диаграмм: par(), title(), lines(), legend(). Сохранение диаграмм в разных форматах и с разным разрешением. Работа с пакетом ggplot2.
  • Введение в индуктивную статистику. Статистические тесты
    Лекция 5. Статистические гипотезы: альтернативная и нулевая. Статистические ошибки: первого и второго родов. Статистическая значимость. Лекция 6. Статистика хи-квадрат и ее разновидности. Вычисление хи-квадрата вручную. Примеры использования статистики хи-квадрат в политологических исследованиях. Лекция 7. Биномиальный тест. Сравнение выборок: общее представление о статистических тестах (параметрические – непараметрические; двусторонние – левосторонние – правосторонние). Параметрические тесты: t-тест для независимых и парных выборок. Непараметрические тесты: тест Вилкоксона (Манна-Уитни) для независимых и парных выборок. Тест Шапиро-Уилкса для проверки нормальности распределения. Иллюстрация работы статистических тестов. Семинар 6. Расчет в R статистики хи-квадрат. Работа с электоральной статистикой: сравнение результатов голосования за разные партии на разных УИКах в ЕДГ-2016. Семинар 7. Расчет биномиального теста, t-теста, теста Вилкоксона (Манна-Уитни), теста Шипиро-Уилкса. Работа с электоральной статистикой: сравнение значений разных индексов ЭЧП.
  • Корреляция и ковариация
    Лекция 8. Корреляция и ковариация. Коэффициент корреляции Пирсона. Интерпретация значений коэффициента корреляции. Значимость коэффициента корреляции. Коэффициент корреляции Спирмена. Корреляционная матрица. Семинар 8. Проведение корреляционного анализа и построение корреляционных матриц в R. Анализ содержания политологических исследований, использовавших корреляционный анализ.
  • МНК-регрессия: принцип, интерпретация, оформление регрессионной выдачи
    Лекция 9. Отличие регрессии от корреляции. Зависимая и независимая переменные. Метод наименьших квадратов (МНК): суть, допущения. Парная линейная регрессия: уравнение регрессии, интерпретация регрессионной выдачи. Коэффициент детерминации (R 2 ). Лекция 10. Множественная линейная регрессия: уравнение регрессии, параметры, рассчитываемые для независимых переменных, значение F-статистики для регрессионной модели. Сравнение регрессионных моделей. Нюансы интерпретации коэффициента детерминации и стандартизированных коэффициентов для независимых переменных. Лекция 11. Оформление результатов регрессионной выдачи: примеры из политологических исследований. Оформление результатов регрессионной выдачи в R: пакет stargazer. Композиционное построение исследований, использующих регрессионный анализ. Нюансы использования категориальных и порядковых переменных в регрессионном анализе. Семинар 9. Реализация парной линейной регрессии в R. Визуализация сути метода наименьших квадратов. Интерпретация результатов регрессионного анализа. Семинар 10. Реализация множественной линейной регрессии в R. Сравнение регрессионных моделей. Интерпретация результатов регрессионного анализа. Семинар 11. Рассмотрение композиционного построения политологического исследования, использующего в качестве основного метода анализа данных множественную линейную регрессию. Рассмотрение особенной включения в регрессионные модели категориальных и порядковых переменных: работа с базой данных Duncan.
  • Технические и содержательные проблемы регрессионных моделей. Регрессионная диагностика
    Лекция 12. Предпосылки МНК-регрессии. Технические проблемы регрессионных моделей: мультиколлинеарность, гетероскедастичность, выбросы, влиятельные наблюдения. Диагностика и способы решения технических проблем регрессионных моделей. Лекция 13. Содержательные проблемы регрессионных моделей: эндогенность, исключение из анализа релевантных объяснительных переменных, включение в анализ нерелевантных объяснительных переменных. Проблема смещения выборки. Семинар 12. Подробное рассмотрение сути технических проблем регрессионных моделей: мультиколлинеарности, гетероскедастичности, выбросов и влиятельных наблюдений. Работа с базой данных Duncan и базами данных, собранными студентами. Работа с функциями идентификации мультиколлинеарности: vif(); гетероскедастичности: ncvTest(), spreadLevelPlot(); выбросов: qqplot(), outlierTest(); влиятельных наблюдений: influencePlot() и др. Семинар 13. Рассмотрение проблем смещения выборки (отбора единиц анализа по зависимой переменной), эндогенности, исключения из анализа релевантных объяснительных переменных и включения в анализ нерелевантных объяснительных переменных.
  • Обобщенные линейные модели: краткий обзор
    Лекция 14. Обобщенные линейные модели: суть, виды. Логистическая регрессия: суть, виды. Уравнение бинарной логистической регрессии. Параметры оценки логистических моделей. Выдача логистической регрессии, ее интерпретация. Предсказанные вероятности и отношения шансов. Лекция 15. Порядковая логистическая регрессия: особенности. Выдача порядковой логистической регрессии. Предсказанные вероятности и отношения шансов для порядковой логистической регрессии. Подведение итогов курса. Семинар 14. Реализация логистической регрессии в R. Рассмотрение политологического исследования, использующего в качестве основного метода анализа данных логистическую регрессию. Семинар 15. На семинарском занятии проводится контрольная работа.
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа
    Выполнение заданий в письменной форме. Время контрольной работы 1 час 20 минут
  • неблокирующий Домашнее задание
    Подготовка четырех файлов, отражающих работу студента с количественными данными
  • неблокирующий Экзамен
    Выполнение заданий в письменной форме. Время экзамена 1 час 20 минут
  • неблокирующий Аудиторная работа
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    Накопленная оценка по дисциплине рассчитывается с помощью взвешенной суммы оценок за отдельные формы текущего контроля знаний и аудиторную работу следующим образом: Оценка накопленная = 0.4 * Оценка за контрольную работу + 0.4 * Оценка за домашнее задание + 0.2 * Оценка за работу на семинарах. Результирующая оценка по дисциплине (которая идет в диплом) рассчитывается следующим образом: Оценка результирующая = 0.6 * Оценка накопленная + 0.4 * Оценка за экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Field, A. V. (DE-588)128714581, (DE-627)378310763, (DE-576)186310501, aut. (2012). Discovering statistics using R Andy Field, Jeremy Miles, Zoë Field. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.363067604
  • Golosov, G. V., & Konstantinova, M. (2016). Gubernatorial Powers in Russia The Transformation of Regional Institutions Under the Centralizing Control of the Federal Authorities. Problems of Post-Communism, 63(4), 241–252. https://doi.org/10.1080/10758216.2016.1146906
  • R в действии. Анализ и визуализация данных на языке R, Кабаков, Р.И., 2014

Рекомендуемая дополнительная литература

  • Geddes, B. (DE-588)171415787, (DE-576)132211866. (2003). Paradigms and sand castles : theory building and research design in comparative politics / Barbara Geddes. Ann Arbor, Mich.: University of Michigan Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.104638176