We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Machine Learning

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Course type:
Compulsory course
When:
1 year, 3, 4 module

Instructor


Фирсанова Виктория Игоревна

Программа дисциплины

Аннотация

Целями освоения дисциплины является знакомство студентов с основными задачами и методами машинного обучения; применение методов машинного обучения для решения задач автоматической обработки текстов, умение пользоваться предобученными моделями и обучать собственные модели на разных типах данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • познакомить студентов с основными задачами и методами машинного обучения;
  • научить применять машинное обучения для решения задач автоматической обработки текстов.
Планируемые результаты обучения

Планируемые результаты обучения

  • анализирует преимущества и недостатки разных алгоритмов кластеризации, подбирает оптимальное количество классов
  • использует предобученные модели для получения контекстных векторных представлений
  • анализирует преимущества и недостатки разных алгоритмов классификации; обучает модели бинарной и многоклассовой классификации
  • воспроизводит и интерпретирует основные термины и понятия, используемые в дальнейшем при освоении курса умеет анализировать функцию и построить график функций
  • обучает регрессионные модели; понимает особенности использования различных регрессионных моделей.
  • обучает случайный лес, градиентный бустинг, пользовуется xgboost, lightgbm и catboost, применяет стекинг; обучает нейронные классификаторы с использованием сверточных слоев в cnn, подбирает параметры в сверточных слоях
  • обучает нейронные классификаторы с использованием рекуррентных слоев в keras (gru, lstm), обучает seq2seq модели, использует предобученные векторные представления; обучает нейронные классификаторы с использованием слоев Embedding, Dense в keras, выбирает нужную функцию потерь и оптимизатор
  • обучает нейронные классификаторы с использованием рекуррентных слоев в rnn (gru, lstm), используя предобученные векторные представления
  • обучает ранжирующие модели; оценивает результаты ранжирования
  • разбивает выборку на обучающую и тестовую; разбивает выборку на фолды и производит кросс-валидацию
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение. Понятие «машинное обучение».
  • Классификация.
  • Регрессия
  • Валидация.
  • Ансамбли.
  • Кластеризация.
  • Ранжирование.
  • Нейронные сети (keras)
  • Нейронные сети (cnn).
  • Нейронные сети (rnn)
Элементы контроля

Элементы контроля

  • неблокирующий Проект
    На итоговом контроле студент должен продемонстрировать владение основными навыками из пройденных тем дисциплины. Итоговый контроль проводится в форме индивидуального проекта. Проект подразумевает самостоятельное решение студентом практической задачи с помощью машинного обучения от начала (подготовка данных) и до конца (оценка качества и анализ ошибок, выбор лучшего метода). Студент может использовать как уже существующие данные, так и собрать всё самостоятельно. Темы должны быть заранее (не менее 3 недель до сдачи) согласованы с преподавателем. Проект сдаётся письменно. Оценка за проект выставляется по десятибалльной шкале.
  • неблокирующий Домашнее задание
    Домашние задания представляют собой небольшие практические задания, которые выполняются студентами вне аудитории. Домашние работы сдаются за 2 дня до следующего занятия (до 23:59 предыдущего дня). После проверки заданий студенты получают обратную связь и оценку по своей работе по почте. Работы, которые были сданы после крайнего срока, штрафуются на три балла. Оценки за домашние задания выставляются в рабочую ведомость, перед экзаменом модуля оценки за домашние задания усредняются и выставляется единая средняя оценка по десятибалльной шкале. При необходимости осуществляется дистанционная поддержка контроля (выдача заданий, проверка работ и др.) с помощью электронных ресурсов филиала.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 4th module
    0.35 * Домашнее задание + 0.35 * Домашнее задание + 0.3 * Проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Златопольский, Д. М. Основы программирования на языке Python / Д. М. Златопольский. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2018. — 396 с. — ISBN 978-5-97060-641-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131683 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Федоров, Д. Ю.  Программирование на языке высокого уровня Python : учебное пособие для среднего профессионального образования / Д. Ю. Федоров. — 2-е изд. — Москва : Издательство Юрайт, 2019. — 161 с. — (Профессиональное образование). — ISBN 978-5-534-11961-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/446505 (дата обращения: 28.08.2023).

Рекомендуемая дополнительная литература

  • Лучано, Р. Python. К вершинам мастерства / Р. Лучано , перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2016. — 768 с. — ISBN 978-5-97060-384-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93273 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Кессель Ксения Витальевна
  • Фирсанова Виктория Игоревна