Данный курс представляет собой адаптацию общеуниверситетского курса по анализу данных и направлен на формирование компетенций в области статистики и анализа данных. В курсе будут рассмотрены темы, которые необходимы для успешного освоения основных понятий и методов, связанных с анализом данных. Дисциплина реализуется с помощью онлайн-курса «Учебник по Анализу данных (Начальный)» (https://edu.hse.ru/course/view.php?id=136231).
Цель освоения дисциплины
Целью освоения дисциплины «Анализ данных» является овладение студентами основами статистики и анализа данных для применения в решении различных практических задач.
Планируемые результаты обучения
Понимать и корректно использовать основные статистические понятия
Фильтровать данные по нескольким условиям
Создавать сводные таблицы
Вычислять коэффициент корреляции Пирсона и интерпретировать полученные результаты
Визуализировать данные с помощью простейших видов диаграмм: линейной, точечной, столбчатой
Сортировать данные
Переводить значения признака в z-оценки
Обрабатывать пропущенные значения и выбросы
Корректно открывать табличные данные различных форматов
Вычислять описательные статистики и интерпретировать полученные результаты
Использовать модель линейной регрессии, а также уметь оценивать (MSE, MAE) и интерпретировать полученные результаты
Использовать Excel в применении к анализу данных
Создавать новые переменные и перекодировать значения
Содержание учебной дисциплины
Введение в инструменты
Введение в статистику. Базовые манипуляции с данными
Генеральная совокупность и выборка. Частотные таблицы и распределения
Описательные статистики: меры центральной тенденции и разброса
Z-оценка. Выбросы.
Корреляция
Введение в визуализацию данных
Линейная регрессия
Элементы контроля
Самостоятельные работы
20-минутные тесты, проводимые на семинарах по пройденному материалу. Каждый тест оценивается по 10-балльной шкале, в итоговую оценку идет среднее всех тестов.
Синхронный элемент контроля.
Пишутся в начале семинара. В случае опоздания время теста не продлевается
Практические работы
Вместе с заданием выдаются требования к результатам и сообщается максимальный балл за выполнение каждого из требований. Итоговая оценка за работу вычисляется как сумма набранных баллов или по правилам, прописанным в тексте работы, при их наличии. За задания могут выставляться частичные баллы в соответствие с долей выполненного задания, если критерии сформулированы в тексте задания.
Совмещенный элемент контроля.
Оценивается по 10-балльной шкале.
При выполнении задания запрещено использование генеративных моделей ИИ. При нарушении использования ИИ за задание выставляется оценка 0.
Экзамен
Контрольная, основанная на Спецификации НЭ по Анализу данных 2025-26 года начального уровня.
Оценивается по 10-балльной шкале.
Спецификация и демонстрационный вариант заданий опубликованы и доступны в курсе подготовки к НЭ по анализу данных (https://edu.hse.ru/course/view.php?id=136231)
Подлежит обязательной пересдаче при ликвидации академической задолженности.
Синхронный элемент контроля.
Активность на семинарах
Оцениваются ответы на вопросы и решение задач на занятии. За один семинар можно получить один "+". При выполнении задания запрещено использование генеративных моделей ИИ. При нарушении правил использования ИИ данные ответы на вопросы засчитаны быть не могут.
Промежуточная аттестация
2025/2026 3rd module
0.3 * Самостоятельные работы + 0.3 * Экзамен + 0.2 * Практические работы + 0.2 * Активность на семинарах
Список литературы
Рекомендуемая основная литература
Essentials of statistics for the behavioral sciences, Gravetter, F. J., 2014
Преподаватель
Кирина Маргарита Александровна
Программа дисциплины
Аннотация
Цель освоения дисциплины
Планируемые результаты обучения
Содержание учебной дисциплины
Элементы контроля
Промежуточная аттестация
Список литературы
Рекомендуемая основная литература
Авторы