• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Large-Scale Machine Learning

2021/2022
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Delivered at:
Department of Informatics
Course type:
Elective course
When:
1 year, 3, 4 module

Instructor


Bryksin, Timofey

Программа дисциплины

Аннотация

Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков работы с большими данными и знакомит слушателей с основными задачами машинного обучения на больших данных, их особенностями и ограничениями. Для освоения дисциплины студентам необходимо иметь знания, полученные в результате изучения дисциплин «Математический анализ», «Линейная алгебра и геометрия», «Теория вероятностей и математическая статистика», «Алгоритмы и структуры данных», «Машинное обучение».
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление студентов с основными задачами машинного обучения на больших данных, их особенностями и ограничениями.
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеть инструментами обработки данных в парадигме MapReduce
  • владеть инструментами обработки данных в парадигме MapReduce;
  • Знать особенности распараллеливания алгоритмов машинного обучения для применения на больших данных
  • знать особенности распараллеливания алгоритмов машинного обучения для применения на больших данных;
  • Уметь работать с большими данными в реальных задачах
  • уметь работать с большими данными в реальных задачах.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Онлайн обучение и линейные модели
  • Введение в Apache Spark и оптимизация гиперпараметров
  • Рекомендательные системы
  • Бустинг для больших данных
  • Нейросети
  • LSH для нахождения похожих объектов
  • Кластеризация больших данных
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Домашнее задание 3
  • блокирующий Устный экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 4 модуль
    0.18 * Домашнее задание 3 + 0.16 * Домашнее задание 2 + 0.5 * Устный экзамен + 0.16 * Домашнее задание 1
Список литературы

Список литературы

Рекомендуемая основная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Murphy, K. P. (2012). Machine Learning : A Probabilistic Perspective. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=480968