We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data interpretation and visualization methods

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
Department of Informatics
Course type:
Elective course
When:
1 year, 2, 3 module

Instructor


Зверев Светослав Игоревич

Программа дисциплины

Аннотация

Цель курса - дать слушателям основные инструменты для того, чтобы уметь критически анализировать результаты исследований, уметь описывать, визуализировать и презентовать данные. Студенты познакомятся с языком R - универсальным инструментом анализа и визуализации данных и машинного обучения, обладающим большим и дружелюбным сообществом. Будут освоены методы обработки данных разных типов (чисел, категорий, строк, дат), создания полезных визуализаций результатов и эффективные воспроизводимые отчёты и интерактивные презентации. В результате освоения курса студенты будут способны быстро и эффективно провести исследование данных, графически исследовать ключевые закономерности и представить их в виде интерактивного отчета или дашборда, построить базовые предсказательные модели.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у слушателей знаний относительно методов и подходов к анализу и представлению данных.
  • Формирование у слушателей знаний о синтаксисе, основных объектах и функциях языка R.
  • Формирование навыка анализа и визуализации данных с помощью функционала языка R.
Планируемые результаты обучения

Планируемые результаты обучения

  • Визуализирует имеющуюся информацию с помощью различных инструментов.
  • Применять основные методы анализа данных в математической статистике и машинном обучении.
  • Подбирает наиболее подходящий инструмент анализа данных в соответствие с практической целесообразностью.
  • Воспроизводит основы синтаксиса, перечень основных объектов и функций в языке R.
  • Определяет параметры данных, значимых для проведения анализа данных.
  • Воспроизводит основные методы анализа данных в математической статистике и машинном обучении.
  • Интерпретирует наиболее эффективный инструмент анализа данных исходя из структуру данных и поставленной задачи.
  • Анализирует значимые (интегральные) параметры данных исходя из структуры данных и поставленной задачи.
  • Формирует отчетность по итогам анализа данных.
  • Располагает навыком написания на языке R кода, реализующего следующие действия: создания объектов, загрузка данных, обработка данных, корректировка данных, анализ полученных данных, визуализация данных, представление полученных данных.
  • Располагает навыком решения практического задания (кейса) от этапа анализа структуры данных, отрасли экономики, к которым эти данные относятся, до загрузки, обработки и выдачи на основании данных результата в виде рекомендации по принятию управленческого решения.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Вводное занятие
  • Тема 2. Методы математической статистики для анализа данных.
  • Тема 3. Методы машинного обучения для анализа данных
  • Тема 4. Выбор значимых параметров при анализе данных
  • Тема 5. Демонстрация практических примеров анализа данных
  • Тема 6. Препроцессинг данных
  • Тема 7. Интерполяция и экстраполяция данных
  • Тема 8. Сглаживание данных
  • Тема 9. Графическое представление данных
  • Тема 10. Формирование отчетности по итогам анализа данных
  • Тема 11. Синтаксис языка R, основные объекты данных в R
  • Тема 12. Загрузка данных в языке R
  • Тема 13. Условный оператор в языке R
  • Тема 14. Циклы в языке R
  • Тема 15. Математические операции в языке R
  • Тема 16. Практическая проектная работа
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
    В рамках курса будет изучено пять тем. По каждой теме требуется выполнить домашнее задание. За каждое из заданий студент может максимально получить 0.5 балла
  • неблокирующий Промежуточный контроль
    По итогу изучения каждой из пяти тем курса, студентам будет представлен тест как форма промежуточного контроля. За каждый тест студент может максимально получить 0.5 балла.
  • неблокирующий Итоговый проект
    По итогу освоения курса студент может сдать зачетную контрольную работу, либо выполнить в течение семестра курсовой проект, создание которого позволит получить положительную оценку за зачетное мероприятие. Максимально за созданный проект или сданный зачет Вы сможете получить 2 балла.
  • неблокирующий Активность на занятиях
    За активное участие в ходе семинара: ответы, комментарии, помощь в написании программ, студент получаете балл. За каждый активный семинар студент получает 1/10 балла.
  • неблокирующий Посещаемость занятий
    В рамках курса планируется 14 занятий. За каждое посещенное занятие студент получает 1/10 балла. Если студент пропустил занятие по болезни, оно исключается из расчета и не учитывается при подсчете балла (то есть общий балл делится на меньшее количество занятий).
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    Максимум за курс - 10 баллов. Посещение занятий – 1.4 балла Активность на занятиях – 1.4 балла Домашние задания – 2.5 балла Промежуточный контроль – 2.5 балла Итоговый проект/зачет – 2.2 балла
Список литературы

Список литературы

Рекомендуемая основная литература

  • Long, J. D., & Teetor, P. (2019). R Cookbook : Proven Recipes for Data Analysis, Statistics, and Graphics: Vol. Second edition. O’Reilly Media.
  • Wickham, H. (2015). Advanced R, Second Edition. Boca Raton, FL: Chapman and Hall/CRC. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=934735
  • Wickham, H., & Grolemund, G. (2016). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1440131

Рекомендуемая дополнительная литература

  • Приходько, М. А. Математическая статистика и анализ данных / М. А. Приходько, А. В. Приходько. — Омск : Омский ГАУ, 2014. — 60 с. — ISBN 978-5-89764-460-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/60684 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Храбров Александр Игоревич