• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Структура программы

1 год

1 год
1 2 3 4

Линейная алгебра в машинном обучении

Основная цель курса - напомнить основные факты и базовые понятия линейной алгебры, активно используемые в современных алгоритмах машинного обучения и анализа данных.

Численные методы в машинном обучении

Цель этого адаптационного курса - напомнить слушателям основные приближенные методы решения задач интерполяции, аппроксимации, приближённого решения алгебраических и дифференциальных уравнений, возникающих при работе с данными, сформировать у слушателей  практические навыки работы с численными данными в области машинного обучения, оптимизации и имитационного моделирования.

Глубокое обучение

Глубокое обучение - популярная область, в которой используются нейронные сети сложной архитектуры. Такие системы дают лучшие результаты в таких областях как обработка изображений и видео, звука и текста. В курсе будут рассмотрены основные типы архитектур, принципы работы и обучения глубоких нейронных сетей. Помимо этого студенты получат практические навыки по вышеупомянутым областям применения.

Теория вероятности и математическая статистика

Курс теории вероятностей и математической статистики  является одним из основных пререквизитов как к базовым (машинное обучение, анализ данных), так и к специальным курсам данного направления. В этом адаптационном курсе слушателям напоминаются основные понятия математической статистики, показывается, как используются эти понятия в конкретных практических задачах анализа данных.

Базы данных

Реляционные базы данных были и остаются самым популярным средством хранения информации со сложной структурой. Принципы, лежащие в основе реляционных баз данных, широко применяются во многих областях информационных технологий. В этом курсе мы расскажем о теоретических основах функционирования реляционных систем и практических методах проектирования реляционных баз данных.

Анализ изображений

Данная дисциплина направлена на овладение навыками анализа изображений, сегментации изображений. Студенты получат представление об основных алгоритмах из области анализа изображений. Научатся проводить сегментацию и детектировать объекты на изображении используя методы компьютерного зрения и глубинного обучения.

Основы алгоритмов

В этом адаптационном курсе мы напомним основные, базовые алгоритмы и структуры данных, а также разберем некоторые специальные алгоритмы, активно использующиеся в машинном обучении и анализе данных.

Теория игр

В наше время пользователи
перестают быть внешним элементом IT систем: целенаправленные действия
отдельных групп пользователей могут менять правила игры для всех
остальных, существенно влияя не только на функционирование самой
системы, но и на весь мир вокруг. Наиболее известный пример подобного
- манипуляции информацией в социальных сетях и fake news, что никак не
прогнозировалось при их разработке - и это только лишь вершина
айсберга. Как следствие, грамотные специалисты в области программирования, машинного обучения и анализа данных должны учитывать стратегические действия пользователей и перекрёстные
эффекты, тем самым попадая в предметную область теории игр. Более
подробное обсуждение этой и других проблем и составит основное содержание этого курса.

Deep Reinforcement Learning

Обучение с подкреплением - область машинного обучения, которой пророчат создание искусственного интеллекта. На лекциях будут рассматриваться современные алгоритмы глубокого обучения с подкреплением, использующие нейронные архитектуры и способные управлять гуманоидными роботами и обыгрывать людей в таких играх как в Dota2 и Go. В данном курсе, помимо ознакомления с теоретическими основами, студентам также предстоит самостоятельно реализовать различные алгоритмы.

Методы оптимизации

В этом адаптационном курсе мы напомним основные методы решения оптимизационных задач, необходимые для понимания алгоритмов машинного обучения, а также расскажем о применении этих методов в конкретных практических задачах машинного обучения и анализа данных. 

Современные методы анализа данных

В рамках данного курса мы подробно разберем все основные этапы анализа данных при помощи Python. Слушатели научатся без труда манипулировать данными, используя как стандартные методы Python, так и специальные пакеты и библиотеки. Мы выясним также, как применять основные методы математической статистики (t-тест, корреляция, регрессия, дисперсионный и регрессионный анализ и др.) в задачах анализа данных. Особое внимание в курсе будет уделено визуализации получаемых результатов. 

Введение в Unix и скриптовые языки (Unix + Python)

В этом адаптационном курсе мы напомним основные принципы работы в ОС Unix, основные конструкции и идиомы языков программирования Python и Bash, необходимые для изучения других дисциплин, предусмотренных программой, а также для применения в задачах машинного обучения и анализа данных. Слушатели научатся создавать программы, решающие задачи по заданному алгоритму на языке Python и скрипты на языке Bash, а также пользоваться интерпретатором языка Python для их выполнения.

Машинное обучение

Машинное обучение - подход к решению задачи, в котором вместо прямого задания аналитического или вычислительного метода, мы задаем общий вид решения и алгоритм подобора точного вида. В курсе будут рассмотрены основные типы алгоритмов, принципы их работы и обучения. Помимо этого студенты получат практические навыки по вышеупомянутым областям применения.

Параллельные вычисления

Высокопроизводительные вычисления (high performace computing) - область программной инженерии, позволяющая удовлетворять такие важные для многих классов систем требования, как скорость обработки данных, времени отклика и масштабируемость. В курсе делается акцент на комплексное умение с использованием различных технических и архитектурных решений уметь проектировать как системы обработки больших объёмов данных, так и системы, близкие к жёсткому реальному времени. Теоретическая подготовка в области неблокирующих алгоритмов, теории параллельного программирования и широкий спектр рассматриваемых технологий анализа и повышения производительности, от простого мнгопоточного кода до применения транзакционной памяти, позволяет студентам применять полученные знания в прикладных работах по другим дисциплинам. Практическая часть курса затрагивает наиболее применимые в современном программировании шаблоны и подходы к реализации высокопроизводительных приложений.
  МАГОЛЕГО
или
Курс Школы анализа данных

2 год

2 год
1 2 3 4

Машинное обучение - II

Правильный выбор, подготовка и описание данных — ключевой этап работы над любой задачей машинного обучения. В данном курсе мы расскажем о том как собирать данные. Описывать их с помощью признаков и анализировать это описание. Поймем как узнать какой признак и как влияет на результат обучения. Узнаем как работать с необычными признаками, такими как: категориальные, последовательности и пр. Научимся определять истинную размерность задачи и ее минимизировать.

Представление знаний

Целью освоения дисциплины «Представление знаний» является формирование у студентов теоретических знаний и практических навыков представления знаний, а также применения и создания различных методов сущностно-ориентированного поиска. В результате изучения этой дисциплины студенты будут владеть основными концепциями представления знаний в различных областях, иметь практические навыки в создании объектно-ориентированных моделей представления знаний, владеть навыками разработки различных систем знаний и сущностно-ориентированного поиска.
 

Информационный поиск

Поиск информации, от поиска файлов на ноутбуке до поиска отелей на соответствующих веб-сайтах, давно стал частью нашей повседневной жизни. Курс рассматривает, как устроены подобные системы поиска информации: от сбора данных, их обработки и хранения, до ранжирования результатов по запросу пользователя и оценки качества этих результатов. После прохождения курса студенты будут знать основные методы работы поисковых систем и смогут создать собственную систему поиска информации с нуля.

Анализ текстов

Методы обработки естественного языка (ОЕЯ) находят сегодня применение во многих областях. В курсе рассматриваются базовые инструменты ОЕЯ - морфологический и синтаксический анализ, языковые модели и лексическая семантика, а также популярные приложения — информационный и вопросно-ответный поиск, автоматическое реферирование, анализ тональности, извлечение информации и машинный перевод. Домашние задания позволяют получить практические навыки работы с текстовыми данными.

Машинное обучение на больших данных

Несмотря на мощности современных компьютеров, во многих задачах связанных с большими данными мы сталкиваемся с тем, что одной машины не хватает не только для обработки, но и даже для хранения данных. Целью данной дисциплины является освоение алгоритмов и методов для параллельного и потокового машинного обучения на больших данных.
 

Байесовские методы и вероятностные графовые модели

Курс посвящен теоретическим и практическим аспектам сложным графовым архитектурам алгоритмов машинного обучения, отображающих классический подход к решениям проблем (reasoning). 

Нейробайесовские методы

Байесовские методы активно применяются и позволяют получать заметные улучшения во всех областях применения глубокого машинного обучения. Особо важную роль байесовские методы занимают в области генеративных моделей. В рамках данной дисциплины студенты познакомятся с теоретическими основами и принципами применения байесовских методов в глубоком машинном обучении.
 

Беспилотные автомобили

Целью освоения дисциплины «Беспилотные автомобили» является формирование у студентов теоретических знаний и практических навыков по алгоритмам, программному и техническому обеспечению, необходимым для функционирования беспилотных автомобилей.В результате изучения этой дисциплины студенты будут владеть основными программными библиотеками машинного обучения и компьютерного зрения, обработки данных с сенсоров Radar и Lidar, локализации и построения оптимального маршрута и системной интеграции.

Web-поиск

Современные поисковые системы - это не просто алгоритм ранжирования, это огромный индустриальный комплекс с тысячами серверов, баз данных и программ. При этом они обеспечивают ответ на вопрос пользователя за доли секунды. Целью данной дисциплины является освоения архитектур, алгоритмов и программных решений, необходимых для функционирования поисковой системы.
 

Программирование на GPU

Целью освоения дисциплины «Параллельные вычисления на графических ускорителях» является формирование у студентов теоретических знаний и практических навыков программирования на графических ускорителях. 11 В результате изучения этой дисциплины студенты будут знать основы устройства различных видеокарт, а также владеть навыками реализация основных алгоритмов на графических ускорителях.
 

Анализ данных на Python в примерах и задачах

В этом курсе мы продолжим начатое в курсе "Современные методы анализа данных" изучение основных методов анализа данных на Python. В этой части курса мы расскажем об использовании нейронных сетей в задачах аппроксимации, регрессионных задачах, задачах распознавания образов, расскажем о работе с Keras и TensorFlow, с разреженными данными, SVD разложении, XGBoost и калибровке моделей.

 

Вычислительная нейробиология

Целью освоения дисциплины «Вычислительная нейробиология» является формирование у студентов теоретических знаний и практических навыков для создания моделей нервных систем человека и животных. В результате изучения этой дисциплины студенты будут владеть основными методами и принципами моделирование нейронов и систем нейронов, позволяющих воспроизводить нервную деятельность 13 отдельных регионов нервной системы

Машинное обучение в SE

Целью освоения дисциплины «Машинное обучение в программной инженерии» является формирование у студентов теоретических знаний и практических навыков использования методом машинного обучения и естественной обработки текстов в области работы с кодом и разработки программного обеспечения. В результате изучения этой дисциплины студенты будут понимать основные области применения методов машинного обучения для задач анализа и генерации кода, анализа хода программных проектов, поиска и исправления ошибок, генерации тестов и тестовых данных, реструктуризации кода и других видов деятельности, осуществляемых в проектах по разработке программного обеспечения.