Структура программы
1 год
1 год | |||
1 | 2 | 3 | 4 |
Линейная алгебра в машинном обучении Основная цель курса - напомнить основные факты и базовые понятия линейной алгебры, активно используемые в современных алгоритмах машинного обучения и анализа данных. | Численные методы в машинном обучении Цель этого адаптационного курса - напомнить слушателям основные приближенные методы решения задач интерполяции, аппроксимации, приближённого решения алгебраических и дифференциальных уравнений, возникающих при работе с данными, сформировать у слушателей практические навыки работы с численными данными в области машинного обучения, оптимизации и имитационного моделирования. | Глубокое обучение Глубокое обучение - популярная область, в которой используются нейронные сети сложной архитектуры. Такие системы дают лучшие результаты в таких областях как обработка изображений и видео, звука и текста. В курсе будут рассмотрены основные типы архитектур, принципы работы и обучения глубоких нейронных сетей. Помимо этого студенты получат практические навыки по вышеупомянутым областям применения. | |
Теория вероятности и математическая статистика Курс теории вероятностей и математической статистики является одним из основных пререквизитов как к базовым (машинное обучение, анализ данных), так и к специальным курсам данного направления. В этом адаптационном курсе слушателям напоминаются основные понятия математической статистики, показывается, как используются эти понятия в конкретных практических задачах анализа данных. | Базы данных Реляционные базы данных были и остаются самым популярным средством хранения информации со сложной структурой. Принципы, лежащие в основе реляционных баз данных, широко применяются во многих областях информационных технологий. В этом курсе мы расскажем о теоретических основах функционирования реляционных систем и практических методах проектирования реляционных баз данных. | Анализ изображений Данная дисциплина направлена на овладение навыками анализа изображений, сегментации изображений. Студенты получат представление об основных алгоритмах из области анализа изображений. Научатся проводить сегментацию и детектировать объекты на изображении используя методы компьютерного зрения и глубинного обучения. | |
Основы алгоритмов В этом адаптационном курсе мы напомним основные, базовые алгоритмы и структуры данных, а также разберем некоторые специальные алгоритмы, активно использующиеся в машинном обучении и анализе данных. | Теория игр В наше время пользователи перестают быть внешним элементом IT систем: целенаправленные действия отдельных групп пользователей могут менять правила игры для всех остальных, существенно влияя не только на функционирование самой системы, но и на весь мир вокруг. Наиболее известный пример подобного - манипуляции информацией в социальных сетях и fake news, что никак не прогнозировалось при их разработке - и это только лишь вершина айсберга. Как следствие, грамотные специалисты в области программирования, машинного обучения и анализа данных должны учитывать стратегические действия пользователей и перекрёстные эффекты, тем самым попадая в предметную область теории игр. Более подробное обсуждение этой и других проблем и составит основное содержание этого курса. | Deep Reinforcement Learning Обучение с подкреплением - область машинного обучения, которой пророчат создание искусственного интеллекта. На лекциях будут рассматриваться современные алгоритмы глубокого обучения с подкреплением, использующие нейронные архитектуры и способные управлять гуманоидными роботами и обыгрывать людей в таких играх как в Dota2 и Go. В данном курсе, помимо ознакомления с теоретическими основами, студентам также предстоит самостоятельно реализовать различные алгоритмы. | |
Методы оптимизации В этом адаптационном курсе мы напомним основные методы решения оптимизационных задач, необходимые для понимания алгоритмов машинного обучения, а также расскажем о применении этих методов в конкретных практических задачах машинного обучения и анализа данных. | Современные методы анализа данных В рамках данного курса мы подробно разберем все основные этапы анализа данных при помощи Python. Слушатели научатся без труда манипулировать данными, используя как стандартные методы Python, так и специальные пакеты и библиотеки. Мы выясним также, как применять основные методы математической статистики (t-тест, корреляция, регрессия, дисперсионный и регрессионный анализ и др.) в задачах анализа данных. Особое внимание в курсе будет уделено визуализации получаемых результатов. | ||
Введение в Unix и скриптовые языки (Unix + Python) В этом адаптационном курсе мы напомним основные принципы работы в ОС Unix, основные конструкции и идиомы языков программирования Python и Bash, необходимые для изучения других дисциплин, предусмотренных программой, а также для применения в задачах машинного обучения и анализа данных. Слушатели научатся создавать программы, решающие задачи по заданному алгоритму на языке Python и скрипты на языке Bash, а также пользоваться интерпретатором языка Python для их выполнения. | Машинное обучение Машинное обучение - подход к решению задачи, в котором вместо прямого задания аналитического или вычислительного метода, мы задаем общий вид решения и алгоритм подобора точного вида. В курсе будут рассмотрены основные типы алгоритмов, принципы их работы и обучения. Помимо этого студенты получат практические навыки по вышеупомянутым областям применения. | Параллельные вычисления Высокопроизводительные вычисления (high performace computing) - область программной инженерии, позволяющая удовлетворять такие важные для многих классов систем требования, как скорость обработки данных, времени отклика и масштабируемость. В курсе делается акцент на комплексное умение с использованием различных технических и архитектурных решений уметь проектировать как системы обработки больших объёмов данных, так и системы, близкие к жёсткому реальному времени. Теоретическая подготовка в области неблокирующих алгоритмов, теории параллельного программирования и широкий спектр рассматриваемых технологий анализа и повышения производительности, от простого мнгопоточного кода до применения транзакционной памяти, позволяет студентам применять полученные знания в прикладных работах по другим дисциплинам. Практическая часть курса затрагивает наиболее применимые в современном программировании шаблоны и подходы к реализации высокопроизводительных приложений. | |
МАГОЛЕГО или Курс Школы анализа данных |
2 год
2 год | |||
1 | 2 | 3 | 4 |
Машинное обучение - II Правильный выбор, подготовка и описание данных — ключевой этап работы над любой задачей машинного обучения. В данном курсе мы расскажем о том как собирать данные. Описывать их с помощью признаков и анализировать это описание. Поймем как узнать какой признак и как влияет на результат обучения. Узнаем как работать с необычными признаками, такими как: категориальные, последовательности и пр. Научимся определять истинную размерность задачи и ее минимизировать. | Представление знаний Целью освоения дисциплины «Представление знаний» является формирование у студентов теоретических знаний и практических навыков представления знаний, а также применения и создания различных методов сущностно-ориентированного поиска. В результате изучения этой дисциплины студенты будут владеть основными концепциями представления знаний в различных областях, иметь практические навыки в создании объектно-ориентированных моделей представления знаний, владеть навыками разработки различных систем знаний и сущностно-ориентированного поиска. | ||
Информационный поиск Поиск информации, от поиска файлов на ноутбуке до поиска отелей на соответствующих веб-сайтах, давно стал частью нашей повседневной жизни. Курс рассматривает, как устроены подобные системы поиска информации: от сбора данных, их обработки и хранения, до ранжирования результатов по запросу пользователя и оценки качества этих результатов. После прохождения курса студенты будут знать основные методы работы поисковых систем и смогут создать собственную систему поиска информации с нуля. | Анализ текстов Методы обработки естественного языка (ОЕЯ) находят сегодня применение во многих областях. В курсе рассматриваются базовые инструменты ОЕЯ - морфологический и синтаксический анализ, языковые модели и лексическая семантика, а также популярные приложения — информационный и вопросно-ответный поиск, автоматическое реферирование, анализ тональности, извлечение информации и машинный перевод. Домашние задания позволяют получить практические навыки работы с текстовыми данными. | Машинное обучение на больших данных Несмотря на мощности современных компьютеров, во многих задачах связанных с большими данными мы сталкиваемся с тем, что одной машины не хватает не только для обработки, но и даже для хранения данных. Целью данной дисциплины является освоение алгоритмов и методов для параллельного и потокового машинного обучения на больших данных. | |
Байесовские методы и вероятностные графовые модели Курс посвящен теоретическим и практическим аспектам сложным графовым архитектурам алгоритмов машинного обучения, отображающих классический подход к решениям проблем (reasoning). | Нейробайесовские методы Байесовские методы активно применяются и позволяют получать заметные улучшения во всех областях применения глубокого машинного обучения. Особо важную роль байесовские методы занимают в области генеративных моделей. В рамках данной дисциплины студенты познакомятся с теоретическими основами и принципами применения байесовских методов в глубоком машинном обучении. | ||
Беспилотные автомобили Целью освоения дисциплины «Беспилотные автомобили» является формирование у студентов теоретических знаний и практических навыков по алгоритмам, программному и техническому обеспечению, необходимым для функционирования беспилотных автомобилей.В результате изучения этой дисциплины студенты будут владеть основными программными библиотеками машинного обучения и компьютерного зрения, обработки данных с сенсоров Radar и Lidar, локализации и построения оптимального маршрута и системной интеграции. | Web-поиск Современные поисковые системы - это не просто алгоритм ранжирования, это огромный индустриальный комплекс с тысячами серверов, баз данных и программ. При этом они обеспечивают ответ на вопрос пользователя за доли секунды. Целью данной дисциплины является освоения архитектур, алгоритмов и программных решений, необходимых для функционирования поисковой системы. | ||
Программирование на GPU Целью освоения дисциплины «Параллельные вычисления на графических ускорителях» является формирование у студентов теоретических знаний и практических навыков программирования на графических ускорителях. 11 В результате изучения этой дисциплины студенты будут знать основы устройства различных видеокарт, а также владеть навыками реализация основных алгоритмов на графических ускорителях. | |||
Анализ данных на Python в примерах и задачах В этом курсе мы продолжим начатое в курсе "Современные методы анализа данных" изучение основных методов анализа данных на Python. В этой части курса мы расскажем об использовании нейронных сетей в задачах аппроксимации, регрессионных задачах, задачах распознавания образов, расскажем о работе с Keras и TensorFlow, с разреженными данными, SVD разложении, XGBoost и калибровке моделей.
| |||
Вычислительная нейробиология Целью освоения дисциплины «Вычислительная нейробиология» является формирование у студентов теоретических знаний и практических навыков для создания моделей нервных систем человека и животных. В результате изучения этой дисциплины студенты будут владеть основными методами и принципами моделирование нейронов и систем нейронов, позволяющих воспроизводить нервную деятельность 13 отдельных регионов нервной системы | |||
Машинное обучение в SE Целью освоения дисциплины «Машинное обучение в программной инженерии» является формирование у студентов теоретических знаний и практических навыков использования методом машинного обучения и естественной обработки текстов в области работы с кодом и разработки программного обеспечения. В результате изучения этой дисциплины студенты будут понимать основные области применения методов машинного обучения для задач анализа и генерации кода, анализа хода программных проектов, поиска и исправления ошибок, генерации тестов и тестовых данных, реструктуризации кода и других видов деятельности, осуществляемых в проектах по разработке программного обеспечения. |