• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
19
Февраль

Введение в машинное обучение

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 3, 4 модуль

Программа дисциплины

Аннотация

Целями освоения дисциплины является знакомство студентов с основными задачами и методами машинного обучения; применение методов машинного обучения для решения задач автоматической обработки текстов, умение пользоваться предобученными моделями и обучать собственные модели на разных типах данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • познакомить студентов с основными задачами и методами машинного обучения;
  • научить применять машинное обучения для решения задач автоматической обработки текстов.
Планируемые результаты обучения

Планируемые результаты обучения

  • воспроизводит и интерпретирует основные термины и понятия, используемые в дальнейшем при освоении курса умеет анализировать функцию и построить график функций
  • анализирует преимущества и недостатки разных алгоритмов классификации; обучает модели бинарной и многоклассовой классификации
  • обучает регрессионные модели; понимает особенности использования различных регрессионных моделей.
  • использует предобученные модели для получения контекстных векторных представлений
  • разбивает выборку на обучающую и тестовую; разбивает выборку на фолды и производит кросс-валидацию
  • анализирует преимущества и недостатки разных алгоритмов кластеризации, подбирает оптимальное количество классов
  • обучает ранжирующие модели; оценивает результаты ранжирования
  • обучает нейронные классификаторы с использованием рекуррентных слоев в keras (gru, lstm), обучает seq2seq модели, использует предобученные векторные представления; обучает нейронные классификаторы с использованием слоев Embedding, Dense в keras, выбирает нужную функцию потерь и оптимизатор
  • обучает случайный лес, градиентный бустинг, пользовуется xgboost, lightgbm и catboost, применяет стекинг; обучает нейронные классификаторы с использованием сверточных слоев в cnn, подбирает параметры в сверточных слоях
  • обучает нейронные классификаторы с использованием рекуррентных слоев в rnn (gru, lstm), используя предобученные векторные представления
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение. Понятие «машинное обучение».
    Основные термины и понятия, используемые в курсе. Понятие функции, построение графиков различных
  • Классификация.
    Понятие бинарной и многоклассовой классификации. Преимущества и недостатки разным алгоритмов классификации.
  • Регрессия
    Понятие регрессии и регрессионной модели. Различные регрессионные модели и их использование при обучении на языковых данных
  • Валидация.
    Понятие валидации модели, способы валидации. Использование предобученных векторных моделей для контекстных векторов.
  • Ансамбли.
    Понятие ансамбля, тестовой и обучающей выборки. Кросс-валидация выборки
  • Кластеризация.
    Понятие кластеризации и разлисные способы кластеризации. Преимущества и недостатки разных алгоритмов кластеризации
  • Ранжирование.
    Понятие ранжирования. ранжирующие модели, и оценка результатов ранжирования.
  • Нейронные сети (keras)
    Понятие слоя. Виды слоев. Нейронные классификаторы с рекуррентными слоями в keras. seq2seq модели. Нейронные классификаторы с использованием слоев embedding и dense в keras
  • Нейронные сети (cnn).
    Методы “случайный лес”, “градиентный бустинг”, Использование xgboost, lightgbm и catboost. Особенности сверточных слоев в cnn, параметры в сверточных слоях.
  • Нейронные сети (rnn)
    Нейронные классификаторы с использованием рекуррентных слоев в rnn. Обучение gru, lstm с использованием предобученных векторных представлений
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
    Домашние задания представляют собой небольшие практические задания, которые выполняются студентами вне аудитории. Домашние работы сдаются за 2 дня до следующего занятия (до 23:59 предыдущего дня). После проверки заданий студенты получают обратную связь и оценку по своей работе по почте. Работы, которые были сданы после крайнего срока, штрафуются на три балла. Оценки за домашние задания выставляются в рабочую ведомость, перед экзаменом модуля оценки за домашние задания усредняются и выставляется единая средняя оценка по десятибалльной шкале. При необходимости осуществляется дистанционная поддержка контроля (выдача заданий, проверка работ и др.) с помощью электронных ресурсов филиала.
  • неблокирующий Проект
    На итоговом контроле студент должен продемонстрировать владение основными навыками из пройденных тем дисциплины. Итоговый контроль проводится в форме индивидуального проекта. Проект подразумевает самостоятельное решение студентом практической задачи с помощью машинного обучения от начала (подготовка данных) и до конца (оценка качества и анализ ошибок, выбор лучшего метода). Студент может использовать как уже существующие данные, так и собрать всё самостоятельно. Темы должны быть заранее (не менее 3 недель до сдачи) согласованы с преподавателем. Проект сдаётся письменно. Оценка за проект выставляется по десятибалльной шкале.
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.7 * Домашнее задание + 0.3 * Проект
Список литературы

Список литературы

Рекомендуемая основная литература

  • Златопольский Д. М. - Основы программирования на языке Python - Издательство "ДМК Пресс" - 2018 - 396с. - ISBN: 978-5-97060-641-4 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/131683
  • Федоров Д. Ю. - ПРОГРАММИРОВАНИЕ НА ЯЗЫКЕ ВЫСОКОГО УРОВНЯ PYTHON 2-е изд. Учебное пособие для СПО - М.:Издательство Юрайт - 2019 - 161с. - ISBN: 978-5-534-11961-9 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/programmirovanie-na-yazyke-vysokogo-urovnya-python-446505

Рекомендуемая дополнительная литература

  • Лучано Рамальо - Python. К вершинам мастерства - Издательство "ДМК Пресс" - 2016 - 768с. - ISBN: 978-5-97060-384-0 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93273