Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Программная инженерия больших данных

2024/2025
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс по выбору
Когда читается:
2-й курс, 3 модуль

Преподаватель

Программа дисциплины

Аннотация

Дисциплина направлена на формирование у студентов теоретических знаний и практических навыков работы с большими данными. Курс посвящен программному решению проблемы надежного масштабируемого хранения и обработки данных и знакомит с особенностями работы с большими данными. Студенты познакомятся с различными моделями представления и обработки данных, а также освоят работу с контейнерами. Для освоения дисциплины студентам необходимо иметь знания, полученные в результате изучения дисциплин «Современные методы анализа данных», «Алгоритмы и структуры данных».
Цель освоения дисциплины

Цель освоения дисциплины

  • Формирование у студентов теоретических знаний и практических навыков использования методом машинного обучения и естественной обработки текстов в области работы с кодом и разработки программного обеспечения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Умеет выбрать подходящий метод машинного обучения и естественной обработки текстов для создания модели или прототипа инструмента, помогающего в решении задач, возникающих при разработке программного обеспечения.
  • Умеет реализовать сбор и предобработку данных на основе репозитория с исходным кодом.
  • Имеет навыки использования существующих популярных библиотек, реализующих алгоритмы машинного обучения, для решения задач, актуальных в проектах по разработке программного обеспечения.
  • Понимает основные виды деятельности, осуществляемые при разработке программного обеспечения, и то, как в них могли бы быть использованы методы машинного обучения.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Постановка задачи машинного обучения в области программной инженерии
  • Раздел 2. Использования машинного обучения для предсказания и оценки
  • Раздел 3. Использование машинного обучения для задач синтеза кода
  • Раздел 4. Использование машинного обучения для оптимизации архитектуры кода
  • Раздел 5. Использование машинного обучения для поиска дубликатов
  • Раздел 6. Использование техник обработки естественных языков
  • Раздел 7. Использование машинного обучения для анализа кода
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание №1
    Домашнее задание №1 выдается студентам в одном варианте. Срок выполнения домашнего задания – 3 недели. Форма представления обучающимися домашнего задания – программа на одном из распространённых языков программирования.
  • неблокирующий Домашнее задание №2
    Домашнее задание №2 выдается студентам в одном варианте. Срок выполнения домашнего задания – 2 недели. Форма представления обучающимися домашнего задания – программа на одном из распространённых языков программирования.
  • неблокирующий Домашнее задание №3
    Домашнее задание №3 выдается студентам в одном варианте. Срок выполнения домашнего задания – 3 недели. Форма представления обучающимися домашнего задания – программа на одном из распространённых языков программирования.
  • блокирующий Устный экзамен
    Устный экзамен проводится в форме ответов на вопросы экзаменационного билета и дополнительные вопросы по материалам курса. Экзаменационный билет содержит два вопроса. На подготовку ответа выделяется 40 минут.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    Преподаватель учитывает оценку за текущий контроль (домашние задания). Онакопленная = (Од/з1 + Од/з2 + Од/з3) / 3 Результирующая оценка за дисциплину рассчитывается следующим образом: ОРезультирующая= 0,5Онакопленная + 0,5Оэкзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Zimmermann, T., Menzies, T., & Bird, C. (2015). The Art and Science of Analyzing Software Data. Amsterdam: Morgan Kaufmann. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=593414

Рекомендуемая дополнительная литература

  • Kelleher, J. D. (2019). Deep Learning. Cambridge: The MIT Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2234376

Авторы

  • Москвин Денис Николаевич