• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
30
Ноябрь

Машинное обучение для бизнеса

2025/2026
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты
Статус:
Курс обязательный
Когда читается:
4-й курс, 2 модуль

Преподаватели

Программа дисциплины

Аннотация

Этот модульный курс является введением в инструменты машинного обучения. Среднее время освоения курса может варьироваться в зависимости от изначальной подготовки студента. Пререквизитом для освоения курса является знание математики на уровне среднего образования и основ языка программирования Python. Академические успехи студентов оцениваются посредством заданий на программирование в виде контестов, а также письменных элементов контроля в виде тестов. Итоговый экзамен представляет из себя контест с презентацией предложенных студентов способов решения. С помощью заданий курса отрабатываются базовые способы предобработки данных. построения моделей, интерпретации результатов. Курс не подразумевает проведение лекций, все теоретические материалы выдаются студентам на практических занятиях.
Цель освоения дисциплины

Цель освоения дисциплины

  • • Понимание базовых правил синтаксиса, типов данных, встроенных конструкций • Создание пользовательских пайплайнов препроцессинга • Освоение основной библиотеки по машинному обучению на Python: sklearn • Формирование базовых навыков использования Python как инструмента классификации и прогнозирования
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент способен находить и устранять синтаксические и логические ошибки в скриптах
  • Студент способен объяснить основные виды данных и постановки исследовательской задачи
  • Студент способен создавать базовые модели машинного обучения для задач регрессии и классификации, задачи кластеризации
  • Студент способен проводить анализ полученных результатов с целью описания экономических процессов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Постановка задач, типы данных, Пайплайны, рабочий процесс, bias variance tradeoff
  • Тема 2. Классификация: Метрики, несбалансированность, мультикласс
  • Тема 3. Классификация: SVM, логистическая регрессия, наивный байес, knn
  • Тема 4. Регрессия: Метрики, lasso, ridge, elasticnet
  • Тема 5. Случайный лес, градиентный бустинг, ансамбли
  • Тема 6. Кластеризация: Метрики, scaling, normalization, kmean, dbscan
  • Тема 7. Кластеризация: T-sne, PCA, Umap, gaussian mixture
Элементы контроля

Элементы контроля

  • неблокирующий Семинарская работа
  • неблокирующий Контест 1
    Контест 1 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки, результат студента отражается на лидерборде.
  • неблокирующий Контест 2
    Контест 2 представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки решения, результат студента отражается на лидерборде.
  • неблокирующий Контест Экзамен
    Контест Экзамен представляет из себя соревнование на площадке Kaggle для студентов курса. Задачей студентов является получение правильных ответов на задачи предсказания, загружаемых на сайт. Чтобы получить правильные ответы на задачу предсказания, студент должен построить модель машинного обучения, применив знания с пройденных тем курса. Количество попыток студента не ограничено до истечения времени проведения элемента контроля. Студентам запрещается делиться решениями. После загрузки решения, результат студента отражается на лидерборде. Студенты отправляют решения в .ipynb формате для проверки и подготавливают презентацию с обоснованием выбранных методов для решения. Студенты могут сдавать работу в группах до 4 человек.
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.2 * Контест 1 + 0.2 * Контест 2 + 0.4 * Контест Экзамен + 0.2 * Семинарская работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • 9781800206571 - Serg Masís - Interpretable Machine Learning with Python : Learn to Build Interpretable High-performance Models with Hands-on Real-world Examples - 2021 - Packt Publishing - https://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=2901980 - nlebk - 2901980
  • Python для сложных задач: наука о данных и машинное обучение. - 978-5-4461-0914-2 - Плас Дж. Вандер - 2021 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/376830 - 376830 - iBOOKS

Рекомендуемая дополнительная литература

  • Spiliopoulou, M., Gesellschaft für Klassifikation, Schmidt-Thieme, L., & Janning, R. (2014). Data Analysis, Machine Learning and Knowledge Discovery. Cham: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=669270

Авторы

  • Бродская Наталья Николаевна
  • Ефимов Константин Дмитриевич