Собрать, проанализировать и сделать вывод
Руководитель программы «Анализ больших данных в бизнесе, экономике и обществе» Александр Владимирович Сироткин рассказывает о мировой бирже труда, больших данных и актуальности новой магистерской программы, первый набор студентов на которую уже идет.
- Год назад компания LinkedIn, которая занимается одной из крупнейших социальных сетей для бизнеса и вакансиями, выпустила очередной ежегодный рейтинг о том, какие навыки наиболее востребованы в современном мире и какие дают вам наибольшие шансы получить работу с наилучшей зарплатой. На первом месте по результатам 2014 года оказался Statistical Analysis and Data Mining, так как последнее время в мире большой бум информации. Не только LinkedIn, но и многие другие компании и газеты отмечают, что работа статистиком/аналитиком вообще, и в областях Data Science/Machine Learning в частности, являются одними из самых привлекательных видов занятости. За год все немного изменилось, если мы посмотрим на последний релиз The Hottest Skills от LinkedIn, основанный на материалах 2015 года и опубликованный в январе 2016 года, то статистический анализ перестал занимать первое место, его подвинул Cloud and Distributed Computing, облачные технологии и распределенные вычисления. А основная проблема заключается в том, что в современном мире просто анализировать данные становится недостаточным, данных слишком много. Они распределены в разных местах, и сейчас важным становится сделать следующий шаг от просто аналитики к более сложной её составляющей, к большим объемным данным.
Таким образом, мы с новой магистерской программой «Анализ больших данных в бизнесе, экономике и обществе» как никогда актуальны. Мы разрабатывали и готовили ее несколько лет, нашей главной целью было сделать программу, которая покрывает и математику, и технологии, и необходимые знания для анализа данных вообще и анализа больших данных в частности.
Поставленные задачи
Вся программа ориентирована на несколько важных аспектов: разобраться и понять методы, почему некоторые из них работают, другие нет, где и как их можно применять, поговорить о той математике, которая стоит за всем этим. Это нужно для того, чтобы понимать, когда и какие методы можно использовать и как адаптировать существующие методы к новым реалиям и продолжать развивать их дальше. Определённый уровень знания математики нужен для того, чтобы читать и понимать современные статьи с самыми лучшими и передовыми методами.
Вторая вещь, на которую мы делаем акцент в нашей программе - это техническое и практическое воплощение. Существует огромное количество инструментов, и современному аналитику далеко не всегда нужно все придумывать заново. Познакомить с этими инструментами, и есть наша задача, а именно дать необходимые навыки работы с ними, поговорить о том, что такое, например, Spark и почему имеет смысл им пользоваться, когда у вас слишком много данных. Обсудить, как и в каких продуктах концепция MapReduce сейчас воплощается, и как применить ее в конкретных задачах. Через эти вещи мы пытаемся показать нашим магистрам теорию с практической точки зрения, так как в нашем преподавательском составе есть люди, которые этим занимаются и готовы рассказывать про свой опыт.
Наша задача – сформировать, с одной стороны, определённый уровень, достаточный для того, чтобы понимать, почему и как работают наиболее передовые методы, а с другой стороны иметь достаточный запас технической культуры, который позволит, при необходимости, найти правильный инструмент, а возможно и предоставить заказчику бизнес-решение. Например, вам сказали, что есть задача и проблема, вам нужно ответить на вызов. И вы будете готовы это сделать, так как будете знать, как собрать данные, как проанализировать их и сделать вывод. Ваше преимущество состоит в том, что вы понимаете эту проблему как с точки зрения реализации, так и с точки зрения интерпретации.
Определенные курсы нашей программы ориентированы на развитие математической культуры, на понимание методов, а ряд курсов связан с программной реализацией, с работой с языком Python или, например, R, и существующими пакетами. Конечно, есть и курс, посвященный обработке и анализу больших данных, в которых мы рассказываем про различные структуры, как они хранятся, про различные подходы, существующие среды и фреймфорки, которые работают с большими данными. Плюс у нас в программе есть курсы, посвященные отдельным областям, например, анализу текста, и тому, как извлекать осмысленную информацию из текста в интернете.
Мы стараемся дать необходимые экономические знания и навыки, которые позволяют интерпретировать данные, особенно в случае каких-то бизнес-процессов и задач. Современный аналитик должен не только называть числа, но и понимать, как интерпретировать, и в случае, когда мы говорим о прибыли, необходимо довольно четко понимать, как все устроено изнутри, почему экономика растет или падает. Хороший аналитик не только скажет, что происходит, но и объяснит, почему это происходит, а может и найдет решение как это можно исправить.
Научная сфера
На данный момент наша программа формируется и появляется, и, несмотря на то, что она еще не запущена, у нас уже есть контакты в научной сфере. Недавно подписан договор об обмене студентами с университетом Турина, он определяет порядок и условия сотрудничества и обмена между программой магистратуры «Стохастический анализ и анализ данных», реализуемой Департаментом Математики «G. Peano» университета Турина и программой магистратуры «Анализ больших данных в бизнесе, экономике и обществе», реализуемой ШЭМ НИУ ВШЭ – Санкт-Петербург. Мы также планируем, что в ближайшие несколько лет будет развиваться сотрудничество между нашими университетами, и у студентов будет возможность съездить в Италию и посмотреть, как там учат и наоборот.
Магистерская программа частично читается на английском языке, но с приездом иностранных студентов мы планируем сделать ее полностью англоязычной. Современная наука вынуждает переходить на английский язык, так как эта область очень быстро развиваться, например, пока вы ждете, когда нужную книгу переведут, она может даже потерять свою актуальность, яркость и новизну, а большинство статей не переводят на русский вообще.
В этом году мы принимает студентов без сертификатов, но четверть всей программы англоязычна, вы можете прийти с неидеальным английским, но должны быть готовы разговаривать, слушать англоязычных преподавателей, так как мы не можем отставать от других ведущих университетов и специалистов в этой сфере. Также у нас планируется приезд лекторов, которые не знают русского.