We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Large-Scale Machine Learning

2024/2025
Academic Year
RUS
Instruction in Russian
5
ECTS credits
Delivered at:
Department of Informatics
Course type:
Elective course
When:
4 year, 1, 2 module

Instructor

Программа дисциплины

Аннотация

Дисциплина направлена на ознакомление с теоретическими основами и основными принципами машинного обучения, овладение инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов теоретических знаний и практических навыков по основам работы с продвинутыми алгоритмами машинного обучения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает ключевые понятия, цели и задачи использования машинного обучения, методологические основы применения алгоритмов машинного обучения.
  • Умеет визуализировать результаты работы алгоритмов машинного обучения, выбирать метод машинного обучения, соответствующий исследовательской задаче, интерпретировать полученные результаты.
  • Имеет навыки чтения и анализа академической литературы по применению методов машинного обучения, построения и оценки качества моделей.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Анализ размерности данных и работа с признаками
  • Раздел 2. Анализ распределения данных
  • Раздел 3. Интерпретация результатов
Элементы контроля

Элементы контроля

  • блокирующий Проект
    В процессе изучения предмета обучающиеся должны будут применить изученные методы в задаче на данных с платформы Kaggle. Предполагается разделение учащихся на группы.
  • блокирующий Экзамен
    Проверка качества освоения дисциплины производится в форме устного экзамена. Экзамен проводится в формате разбора научной статьи по анализу данных и машинному обучению. Экзаменуемый должен продемонстрировать знание предмета на достаточном уровне для интерпретации современной научной литературы.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.5 * Проект + 0.5 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Murphy, K. P. (2012). Machine Learning : A Probabilistic Perspective. Cambridge, Mass: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=480968

Рекомендуемая дополнительная литература

  • Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The Elements of Statistical Learning : Data Mining, Inference, and Prediction (Vol. Second edition, corrected 7th printing). New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=277008
  • Richert, W., & Coelho, L. P. (2013). Building Machine Learning Systems with Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=619996

Авторы

  • Кузнецов Антон Михайлович
  • Юдаева Оксана Юрьевна