We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Big Data Analysis Technologies

2021/2022
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
2 year, 1, 2 module

Instructor

Программа дисциплины

Аннотация

Настоящая дисциплина относится к профессиональному циклу дисциплин и блоку дисциплин, обеспечивающих базовую подготовку бакалавра для направления подготовки 38.03.04 «Государственное и муниципальное управление». Изучение данной дисциплины базируется на знаниях, полученных при изучении следующих дисциплин: • Математика • Количественные методы анализа данных Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: • Регулирование и анализ рынка труда • Экономическая и социальная статистика Изучение дисциплины проводится в ходе лекционных и семинарских занятий, а также самостоятельной работы с использованием онлайн-курса.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями курса «Технологии анализа больших данных» является формирование у студентов: - системных представлений о технологиях обработки больших данных; - практических навыков обработки и анализа больших массивов информации.
Планируемые результаты обучения

Планируемые результаты обучения

  • Применяет возможности модулей NamPy и matplotlib. Умеет с их помощью анализировать и визуализировать данные.
  • Применяет основные объекты Pandas. Умеет группировать, индексировать и извлекать данные по заданным условиям
  • Применяет основные понятия и основные алгоритмические конструкции Python. Умеет работать со списками, словарями, функциями.
  • Применяет основы моделирования с помощью библиотек Python. Умеет строить модели регрессии и выполнять классификацию объектов.
  • Умеет создавать web - запросы с помощью библиотеки requests
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Введение в анализ больших данных
  • Тема 2. Работа с библиотекой Pandas
  • Тема 3 Анализ данных с NamPy и matplotlib
  • Тема 4. Моделирование в Python
  • Тема 5. Парсинг сайтов и обработка web - запросов.
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
    Экзамен проводится во 2-м модуле 2021 года
  • неблокирующий Экзамен
    Экзамен проведён в 3 модуле 2020 г.
  • неблокирующий Тестовое задание 1 модуля
  • неблокирующий Итоговый тест 1 модуля
  • неблокирующий Тестовое задание 2 модуля
    В течение 2 модуля проводится 2 (два) теста. В качестве оценки за тестовое задание 2 модуля принимается средняя оценка за два проведённых теста.
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 1 модуль
    0.6 * Итоговый тест 1 модуля + 0.4 * Тестовое задание 1 модуля
  • 2021/2022 учебный год 2 модуль
    0.3 * 2021/2022 учебный год 1 модуль + 0.28 * Тестовое задание 2 модуля + 0.42 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт ; перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Маккинни, У. Python и анализ данных / У. Маккинни ; перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Embarak O. Data Analysis and Visualization Using Python: Analyze Data to Create Visualizations for BI Systems. - Apress, 2018.

Авторы

  • Кольцов Сергей Николаевич