We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Hadoop and MapReduce

2024/2025
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Course type:
Compulsory course
When:
3 year, 2, 3 module

Instructor

Программа дисциплины

Аннотация

Дисциплина направлена на ознакомление с теоретическими основами и основными принципами машинного обучения, овладение инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов теоретических знаний и практических навыков по основам работы с продвинутыми алгоритмами машинного обучения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает ключевые понятия, цели и задачи использования машинного обучения, методологические основы применения алгоритмов машинного обучения.
  • Умеет визуализировать результаты работы алгоритмов машинного обучения, выбирать метод машинного обучения, соответствующий исследовательской задаче, интерпретировать полученные результаты.
  • Имеет навыки чтения и анализа академической литературы по применению методов машинного обучения, построения и оценки качества моделей.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Анализ размерности данных и работа с признаками
  • Раздел 2. Анализ распределения данных
  • Раздел 3. Интерпретация результатов
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
    -
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.5 * Домашнее задание + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Murphy, K. P. (2012). Machine Learning : A Probabilistic Perspective. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=480968

Рекомендуемая дополнительная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Richert, W., & Coelho, L. P. (2013). Building Machine Learning Systems with Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619996