We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis

2024/2025
Academic Year
RUS
Instruction in Russian
5
ECTS credits
Delivered at:
Department of Business Informatics and Operations Management
Course type:
Compulsory course
When:
3 year, 1, 2 module

Instructor


Аносов Алексей Петрович

Программа дисциплины

Аннотация

Целью освоения дисциплины «Анализ данных» является формирование навыков систематизации, статистической обработки и анализа структурированных и неструктурированных данных в интересующих областях с использованием современных компьютерных программ.
Цель освоения дисциплины

Цель освоения дисциплины

  • Уметь работать с данными
  • Владеть методами прикладной статистики
Планируемые результаты обучения

Планируемые результаты обучения

  • Уметь планировать и анализировать результаты A/B-тестов
  • Иметь навыки анализа данных необходимые для решения прикладных задач
  • Уметь работать с библиотеками анализа данных на языке Python
  • Уметь работать с библиотеками сбора данных на языке Python
  • Уметь работать работать с библиотеками языка Python для решения статистических задач
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Инструменты для работы с данными
  • Инструменты для сбора данных
  • Прикладная статистика
Элементы контроля

Элементы контроля

  • блокирующий Коллоквиум по numpy, pandas, визуализации (Блокирующий Элемент контроля)
    Вес в итоговой оценке - 20% Блокирующая, сдача на выделенных парах. Беседа с преподавателем с включенной камерой. По несколько маленьких заданий в режиме live coding + вопросы на numpy, pandas, визуализации. Применение генеративных моделей: не допускается
  • неблокирующий Задание по HTML, Requests, Beautiful Soap
    Асинхронный элемент контроля. Применение генеративных моделей: допускается
  • неблокирующий Задание по Selenium
    Асинхронный элемент контроля. Применение генеративных моделей: допускается
  • неблокирующий Финальный проект
    Студенты выполняют задание дома в парах, презентация на последнем занятии перед экзаменом. Задание заключается в том, чтобы подготовить любой проект связанный с анализом данных, включающий все пройденные технологии: библиотеки сбора данных, pandas, библиотеки визуализации, airflow, дэшборд (Streamlit или другой фреймворк) Применение генеративных моделей: допускается
  • неблокирующий Экзамен
    Письменный экзамен, включающий вопросы по всем пройденным темам. Включает как теоретические вопросы, так и задания на код. Применение генеративных моделей: не допускается
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.1 * Задание по HTML, Requests, Beautiful Soap + 0.1 * Задание по Selenium + 0.2 * Коллоквиум по numpy, pandas, визуализации (Блокирующий Элемент контроля) + 0.3 * Финальный проект + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • G. Nair, V. (2014). Getting Started with Beautiful Soup. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=691839
  • Бослаф, С. Статистика для всех : учебное пособие / С. Бослаф , перевод с английского П. А. Волкова [и др.]. — Москва : ДМК Пресс, 2015. — 586 с. — ISBN 978-5-94074-969-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/66475 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Миркин, Б. Г.  Введение в анализ данных : учебник и практикум / Б. Г. Миркин. — Москва : Издательство Юрайт, 2019. — 174 с. — (Авторский учебник). — ISBN 978-5-9916-5009-0. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/432851 (дата обращения: 28.08.2023).
  • Практическая статистика для специалистов Data Science: Пер. с англ. - 978-5-9775-3974-6 - Брюс П. - 2018 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/358886 - 358886 - iBOOKS

Рекомендуемая дополнительная литература

  • Boris Mirkin. (2011). Core Concepts in Data Analysis: Summarization, Correlation and Visualization (Vol. 2011). Springer.
  • Budi Kurniawan - HTML : A Beginner's Tutorial - Brainy Software, 2015-116 - Текст электронный - https://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4339838
  • Дудин, М. Н.  Статистика : учебник и практикум для вузов / М. Н. Дудин, Н. В. Лясников, М. Л. Лезина. — Москва : Издательство Юрайт, 2021. — 374 с. — (Высшее образование). — ISBN 978-5-9916-8908-3. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/470169 (дата обращения: 27.08.2024).

Авторы

  • Будько Виктория Александровна