• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Mathematics and Python for Data Analysis

2019/2020
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Delivered at:
Department of Philology
Course type:
Elective course
When:
2 year, 4 module

Программа дисциплины

Аннотация

Для успешного применения методов анализа данных нужно уметь программировать. Фактическим стандартом для этого в наши дни является язык Python. В данном курсе мы предлагаем познакомиться с его синтаксисом, а также научиться работать с его основными библиотеками, полезными для анализа данных, например, NumPy, SciPy, Matplotlib и Pandas.
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление студентов с основами работы с языком Python в анализе данных. Расширение теоретической и практической подготовки студента в области математического анализа, линейной алгебры, методов оптимизации, теории вероятностей.
Результаты освоения дисциплины

Результаты освоения дисциплины

  • Студент понимает особенности языка Python для анализа данных. Знает, что такое Циклы, функции, генераторы, list comprehension. понимает, как происходит чтение различных данных.
  • Студент ориентируется в Python-библиотеках, содержащих большое количество полезных инструментов: от быстрых операций с многомерными массивами до визуализации и реализации различных математических методов. Владеет основами линейной алгебры — основного математического аппарата для работы с данными.
  • Студент способен с помощью методов оптимизации находить наилучшие значения параметров системы, чтобы минимизировать затраты или максимизировать точность предсказаний, а также имеет представление о с матричными разложениями, которые используются при построении регрессионных моделей, для уменьшения размерности данных, в рекомендательных системах и в анализе текстов.
  • Студент освоил базовые концепции теории вероятностей и статистики, которые необходимы для понимания механизма работы практически всех методов анализа данных. Имеет представление о самых популярных распределениях, знает, какие явления ими описываются и какими статистиками оцениваются их параметры.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение
    Python — один из главных инструментов специалиста в науке о данных. Циклы, функции, генераторы, list comprehension. Функции и их свойства. Предел и производная. Геометрический смысл производной.
  • Библиотеки Python и линейная алгебра
    Pandas. Data Frame. NumPy, SciPy и Matplotlib. Решение оптимизационных задач в SciPy. Системы линейных уравнений. Матричные операции. Ранг и определитель
  • Оптимизация и матричные разложения
    Частные производные и градиент. Касательная плоскость и линейное приближение. Оптимизация негладких функций. Метод имитации отжига. Генетические алгоритмы и дифференциальная эволюция. Нелдер-Мид. Приближение матрицей меньшего ранга.
  • Случайность
    Случайность в теории вероятностей и статистике.Свойства вероятности. Условная вероятность. Оценка распределения по выборке. Важные характеристики распределений. Центральная предельная теорема. Доверительные интервалы.
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа
  • неблокирующий Домашняя работа
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.4 * Домашняя работа + 0.6 * Контрольная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • McKinney, W. (2018). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (Vol. Second edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1605925
  • Бурмистрова Е. Б., Лобанов С. Г.-ЛИНЕЙНАЯ АЛГЕБРА. Учебник и практикум для академического бакалавриата-М.:Издательство Юрайт,2019-421-Бакалавр. Академический курс-978-5-9916-3588-2: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/lineynaya-algebra-425852

Рекомендуемая дополнительная литература

  • - Уэс Маккинли — Python и анализ данных - Издательство "ДМК Пресс" - 2015 - ISBN: 978-5-97060-315-4 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/73074
  • Потапов А. П.-ЛИНЕЙНАЯ АЛГЕБРА И АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ. Учебник и практикум для СПО-М.:Издательство Юрайт,2019-310-Профессиональное образование-978-5-534-01061-9: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/lineynaya-algebra-i-analiticheskaya-geometriya-437430