• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Бакалаврская программа «Управление и аналитика в государственном секторе»

Технологии анализа больших данных

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты
Статус:
Курс обязательный
Когда читается:
2-й курс, 1, 2 модуль

Преподаватель

Программа дисциплины

Аннотация

Настоящая дисциплина относится к профессиональному циклу дисциплин и блоку дисциплин, обеспечивающих базовую подготовку бакалавра для направления подготовки 38.03.04 «Государственное и муниципальное управление». Изучение данной дисциплины базируется на знаниях, полученных при изучении следующих дисциплин: • Математика • Количественные методы анализа данных Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: • Регулирование и анализ рынка труда • Экономическая и социальная статистика Изучение дисциплины проводится в ходе лекционных и семинарских занятий, а также самостоятельной работы с использованием онлайн-курса.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями курса «Технологии анализа больших данных» является формирование у студентов: - системных представлений о технологиях обработки больших данных; - практических навыков обработки и анализа больших массивов информации.
Планируемые результаты обучения

Планируемые результаты обучения

  • Применяет возможности модулей NamPy и matplotlib. Умеет с их помощью анализировать и визуализировать данные.
  • Применяет основные объекты Pandas. Умеет группировать, индексировать и извлекать данные по заданным условиям
  • Применяет основные понятия и основные алгоритмические конструкции Python. Умеет работать со списками, словарями, функциями.
  • Применяет основы моделирования с помощью библиотек Python. Умеет строить модели регрессии и выполнять классификацию объектов.
  • Умеет создавать web - запросы с помощью библиотеки requests
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Введение в анализ больших данных
  • Тема 2. Работа с библиотекой Pandas
  • Тема 3 Анализ данных с NamPy и matplotlib
  • Тема 4. Моделирование в Python
  • Тема 5. Парсинг сайтов и обработка web - запросов.
Элементы контроля

Элементы контроля

  • неблокирующий Экзамен
    Экзамен проводится во 2-м модуле 2021 года
  • неблокирующий Экзамен
    Экзамен проведён в 3 модуле 2020 г.
  • неблокирующий Тестовое задание 1 модуля
  • неблокирующий Итоговый тест 1 модуля
  • неблокирующий Тестовое задание 2 модуля
    В течение 2 модуля проводится 2 (два) теста. В качестве оценки за тестовое задание 2 модуля принимается средняя оценка за два проведённых теста.
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 1 модуль
    0.6 * Итоговый тест 1 модуля + 0.4 * Тестовое задание 1 модуля
  • 2021/2022 учебный год 2 модуль
    0.3 * 2021/2022 учебный год 1 модуль + 0.28 * Тестовое задание 2 модуля + 0.42 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Коэльо, Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт ; перевод с английского А. А. Слинкин. — 2-е изд. — Москва : ДМК Пресс, 2016. — 302 с. — ISBN 978-5-97060-330-7. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/82818 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Маккинни, У. Python и анализ данных / У. Маккинни ; перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Embarak O. Data Analysis and Visualization Using Python: Analyze Data to Create Visualizations for BI Systems. - Apress, 2018.

Авторы

  • Кольцов Сергей Николаевич