• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Программирование в R

2023/2024
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 1 модуль

Преподаватель

Программа дисциплины

Аннотация

R – это язык программирования, специально разработанный для реализации сложных статистических вычислений и продвинутых методов анализа данных. На сегодняшний день он является популярным рабочим инструментом у количественных аналитиков – как в науке (в том числе и разнообразных обществоведческих дисциплинах), так в бизнесе, медиа и других прикладных сферах. Цель данного курса – помочь всем заинтересованным освоить этот язык. В рамках курса будет показано, как использовать R для предварительной подготовки данных, разведывательного анализа и представления результатов, в том числе с использованием функционала экосистемы {tidyverse}. Мы также поговорим об основных принципах написания эффективного и масштабируемого кода и организации аналитического процесса при работе в R и разберём, как использовать язык разметки R markdown для создания отчётов и презентаций по итогам исследовательских проектов. Предполагается, что слушатели знакомы с основами статистики (т.е. понимают такие базовые термины, как вероятность, переменная, распределение, среднее, стандартное отклонение/дисперсия). Опыт работы с другими программами для анализа данных (SPSS, Stata, SAS) или языками программирования общего назначения (Python, C++) является полезным, хотя и необязательным активом.
Цель освоения дисциплины

Цель освоения дисциплины

  • Основная цель данного предмета заключается в том, чтобы помочь студентам освоить базовые навыки работы с языком программирования R для предварительной обработки и разведывательного анализа данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Установить R и Rstudio на персональный компьютер/ноутбук
  • Выполнять простые и продвинутые математические и логические операции с использованием R
  • Применять базовые формальные и неформальные принципы программирования в R. Разбираться в основных классах объектов и структурах данных, реализованных в языке.
  • Импортировать внешние базы данных в R.
  • Чистить, перекодировать, трансформировать, фильтровать и объединять данные с использованием базового функционала R, а также инструментов среды {tidyverse}.
  • Проводить разведывательный анализ данных в R, получать частотные распределения, пропорции, средние и другие меры центральной тенденции, дисперсии, корреляции и т.д. для заданных признаков.
  • Визуализировать данные с использованием базового функционала R, а также библиотеки {ggplot2}.
  • Представлять результаты анализа в табличной форме.
  • Писать собственные команды на языке R, а также профилировать и выявлять/устранять ошибки в коде.
  • Создавать аналитические отчёты с помощью R markdown.
  • Писать собственные команды на языке R, а также профилировать код и выявлять/устранять ошибки в коде
Содержание учебной дисциплины

Содержание учебной дисциплины

  • День 1: вводная информация. Начало работы в R.
  • День 2: разведывательный анализ данных с использованием базовых инструментов R
  • День 3: представление данных с использованием базовых инструментов R.
  • День 4: разведывательный анализ данных с использованием среды {tidyverse}
  • День 5: визуализация данных с помощью библиотек {ggplot2} и {ggpubr}.
  • День 6: Основные принципы программирования в R.
  • День 7: Подготовка аналитических отчётов с помощью R markdown.
Элементы контроля

Элементы контроля

  • неблокирующий Работа в классе
    Участие в дискуссиях и в разборе практических/домашних заданий, ответы на вопросы преподавателя и вопросы преподавателю, которые позволяют аудитории узнать что-то новое либо лучше усвоить материал и прояснить непонятные места. Учитываются как вовлечённость в работу класса (вы демонстрируете желание понять, что происходит вокруг), так и корректность произнесенного вслух (вы демонстрируете понимание; критерии примерно такие же, как и для письменных заданий). Второй компонент, однако, обладает большим весом - по вполне очевидным причинам.
  • неблокирующий Домашние задания
    после некоторых лекций (не всех) вам будут даваться домашние задания. Типичное ДЗ представляет собой набор задач по написанию кода в R, который позволяет ответить на те или иные содержательные вопросы. Иногда от вас будет требоваться прокомментировать/объяснить ваш код. ДЗ сдаются в письменной форме (электронный документ в формате MS Word, обычно – длиной 1-2 стр. 12 шрифтом с единичным междустрочным интервалом). Их следует отправлять на электронную почту преподавателя до начала занятия, на котором разбираются решения соответствующих ДЗ (если не оговорено иное, то это означает, что ваше решение надо прислать до 16:20 вторника, на который было назначено задание). Обратите внимание, что работы, присланные с опозданием, не принимаются. Другими словами, в случае пропуска дедлайна вы автоматически получаете 0 баллов. Исключение может быть сделано только в том случае, если у вас не получилось прислать задание вовремя в силу воздействия непреодолимых внешних причин и вы можете доказать это документально. В таком случае вам будет даваться альтернативное задание эквивалентной сложности по той же теме.
  • неблокирующий Итоговый экзамен
    Письменная работа, в рамках которой, как и в домашних заданиях, вам нужно будет решить ряд задач по написанию кода в целях подготовки и преобразования данных, а также их разведывательного анализа и визуализации (см. пример ниже). Предварительный крайний срок сдачи ваших экзаменационных работ - 16:20, вторник, 24 октября 2023 года (дата и время могут быть впоследствии изменены).
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 1 модуль
    0.6 * Домашние задания + 0.25 * Итоговый экзамен + 0.15 * Работа в классе
Список литературы

Список литературы

Рекомендуемая основная литература

  • R в действии. Анализ и визуализация данных на языке R, Кабаков, Р.И., 2014
  • Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131

Рекомендуемая дополнительная литература

  • Wickham, H. (2015). Advanced R, Second Edition. Boca Raton, FL: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=934735