• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

"Data Analytics in Python"

2020/2021
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Course type:
Compulsory course
When:
1 year, 3, 4 module

Instructors


Волкова Юлия Михайловна


Ефимова Полина Романовна


Krasilnikov, Alexander


Смирнова Анна Вадимовна

Программа дисциплины

Аннотация

Дисциплина не предполагает наличия опыта программирования до начала изучения курса. В ходе изучения дисциплины студенту предлагается самостоятельное изучение азов программирования на языке Python с помощью онлайн курса «Программирование на Python» на платформе Stepik, доступной по адресу: https://stepik.org/course/67/syllabus . После изучения онлайн курса студентам будет предложено. В ходе изучения дисциплины на лекционных и семинарских занятиях студенту будут предложены дополнительные инструменты для формирования наборов данных, в том числе и инструменты для автоматизации загрузки данных из сети Интернет. Дисциплина может являться пререквизитом для изучения дисциплин «Эконометрика», «Статистика», а также для междисциплинарной курсовой работы и выпускной квалификационной работы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Подготовка выпускников к информационно-аналитической и научно-исследовательской деятельности в качестве исполнителей или руководителей младшего уровня
  • на основе полученных в ходе освоения дисциплины знаний продолжение обучения в магистратуре и аспирантуре
Планируемые результаты обучения

Планируемые результаты обучения

  • Узнать особенности языка программирования познакомиться со средой jupyter
  • Знакомство с библиотекой pandas
  • Знакомство с библиотекой requests, чтение и запись из файлов формата csv
  • Знакомство с форматом json, владение типами list и dict
  • Знакомство с регулярными выражениями
  • Знакомство с парсингом HTML разметки сайтов
  • Знакомство с соединением различных массивов данных
  • Знакомство с SQL (Декларативный язык программирования, применяемый для создания, модификации и управления данными в реляционной базе данных, управляемой соответствующей системой управления базами данных.)
  • Онлайн курс «Программирование на Python»
  • Работа с библиотекой BeautifulSoup
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Аналитика данных на Python
    Обработка и преобразование большого количества неструктурированных или неорганизованных данных с целью генерирования ключевой информации об этих данных, которые могли бы помочь в принятии обоснованных решений с помощью языка программирования Python
Элементы контроля

Элементы контроля

  • неблокирующий домашние задания
    Индивидуальное задание для выполнения в рамках самостоятельной работы. В случае уменьшения числа домашних заданий, семинаров и летучек, баллы за не проведенные формы работы перераспределяются пропорционально между оставшимися работами той же формы работ
  • неблокирующий семинарское задание
    Задание на работу в малых группах (в случае аудиторной работы в классе) или индивидуально (в случае дистанционной работы) на семинарах.
  • неблокирующий Контрольная работа 1
    Задание на лекции аналогичное экзаменационному.
  • неблокирующий Контрольная работа 2
    Задание на лекции аналогичное экзаменационном.
  • неблокирующий Экзамен
    Письменная работа с заданиями
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.2 * домашние задания + 0.1 * Контрольная работа 1 + 0.1 * Контрольная работа 2 + 0.2 * семинарское задание + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Python Data Analytics поможет вам освоить мир сбора и анализа данных, используя всю мощь языка Python. В основе этой книги лежит описание pandas, библиотеки с открытым исходным кодом, лицензированной BSD, обеспечивающей высокопроизводительные, простые в использовании структуры данных и инструменты анализа данных для языка программирования Python. Автор Фабио Нелли мастерски демонстрирует силу языка программирования Python в применении к обработке, управлению и извлечению информации. Внутри вы увидите, насколько интуитивно понятным и гибким является обнаружение и передача значимых шаблонов данных с помощью скриптов Python, систем отчетности и экспорта данных. В этой книге рассматривается, как получать, обрабатывать, хранить, управлять и анализировать данные с помощью языка программирования Python. Вы будете использовать Python и другие инструменты с открытым исходным кодом для обработки данных и выявления интересных и важных тенденций в этих данных, которые позволят вам предсказывать будущее. узоры. Независимо от того, имеете ли вы дело с данными продаж, инвестиционными данными (акции, облигации и т. Д.), Медицинскими данными, использованием веб-страниц или любым другим типом набора данных, Python можно использовать для интерпретации, анализа и сбора информации из кучи числа и статистика. Эта книга является бесценным справочником с примерами хранения и доступа к данным в базе данных; он проведет вас через процесс создания отчета; в нем представлены три практических примера или примера, которые вы можете взять с собой для повседневного анализа.

Рекомендуемая дополнительная литература

  • Автоматизация рутинных задач с помощью Python : практическое руководство для начинающих, Свейгарт, Э., 2018
  • Вероятностное программирование на Python : байесовский вывод и алгоритмы, Дэвидсон - Пайлон, К., 2020
  • Изучаем pandas : высокопроизводительная обработка и анализ данных в Python, Хейдт, М., 2018
  • Прикладной анализ текстовых данных на Python : машинное обучение и создание приложений обработки естественного языка, Бенгфорт, Б., 2020