We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analytics in Python

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Compulsory course
When:
3 year, 3 module

Instructors


Ефимов Константин Дмитриевич


Omelyash, Kseniya


Юртаева Яна Николаевна

Программа дисциплины

Аннотация

Python – это интерпретируемый высокоуровневый язык программирования общего назначения. Этот язык удобно применять для сбора, обработки и визуализации данных. Этот одномодульный курс представляет собой расширение функционала языка программирования Python. Среднее время прохождения курса зависит от подготовки студента. Для прохождения курса студенты должны обладать математическими навыками на уровне средней школы. Успеваемость студентов оценивается с помощью заданий по программированию: классных работ и итогового проекта. Примеры и задачи, используемые в курсе, охватывают такие области, как парсинг сайтов и файлов, визуализация данных, машинное обучение на Python. Лекции по данному курсу не читаются, весь теоретический материал дается на семинарах.
Цель освоения дисциплины

Цель освоения дисциплины

  • ● использование Python для сбора данных с сайтов и из файлов ● умение строить информативные визуализации на Python ● знакомство с основами машинного обучения с использованием синтаксиса Python
Планируемые результаты обучения

Планируемые результаты обучения

  • студенты понимают детали применения парсинга для сбора данных с сайтов и умеют создавать код для его применения
  • студенты умеют применять библиотеки Python для использования дополнительного функционала
  • студенты способны применять базовые знания Python и совмещать их с новым материалом
Содержание учебной дисциплины

Содержание учебной дисциплины

  • 1. Способы хранения информации: Pandas, JSON, Pickle
  • 2. Парсинг по API, requests
  • 3. Скрэйпинг: re, bs4
  • 4. Парсинг файлов
  • 5. Описательные статистики; очистка данных; визуализация
  • 6. Линейная регрессия (statsmodels, scikit)
  • 7. Машинное обучение, деревья решений
Элементы контроля

Элементы контроля

  • неблокирующий Семинарские задания
  • неблокирующий Промежуточный и итоговый показ проекта
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.6 * Промежуточный и итоговый показ проекта + 0.4 * Семинарские задания
Список литературы

Список литературы

Рекомендуемая основная литература

  • Паршинцева, Л. С., Многомерный анализ данных на Python : учебник / Л. С. Паршинцева, А. А. Паршинцев. — Москва : КноРус, 2024. — 129 с. — ISBN 978-5-406-12606-6. — URL: https://book.ru/book/951954 (дата обращения: 27.08.2024). — Текст : электронный.

Рекомендуемая дополнительная литература

  • Жуков, Р. А. Язык программирования Python. Практикум : учебное пособие / Р.А. Жуков. — Москва : ИНФРА-М, 2024. — 216 с. + Доп. материалы [Электронный ресурс]. — (Среднее профессиональное образование). - ISBN 978-5-16-015638-5. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2131861

Авторы

  • Юртаева Яна Николаевна
  • Ефимов Константин Дмитриевич
  • Омеляш Ксения Васильевна
  • Бродская Наталья Николаевна