Алгоритмы расчёта территориального охвата для объектов городской среды
В субботу, 11 марта, в корпусе НИУ ВШЭ на Кантемировской состоялся очередной семинар в рамках НУГ «Машинное обучение и социальный компьютинг». Первая часть мероприятия была посвящена продолжению работы с аналитикой текстовых данных, а затем слушатели семинара познакомились с различными приемами визуализации геоданных и методами дальнейшей работы с координатами объектов на географической карте. Основными участниками мероприятия стали представители НУГ, студенты, магистранты, аспиранты и преподаватели ОП «Социология и социальная информатика» и «Политология», а также студенты майнора «Обработка и анализ данных.
На данных массива новостей одного из российских медиа-ресурсов, слушатели более детально познакомились с алгоритмом выделения тем в коллекции документов на основе латентного распределения Дирихле. Результаты позволили соотнести получившиеся темы с оригинальными категориями публикаций на сайте интернет-газеты, а также отследить динамику популярности тематик по времени. Работать с популярными и актуальными новостями оказалось увлекательно, поэтому практически все участвовали в обсуждении и высказывали свои идеи.
Во второй части занятия Ирина Крылова (НУГ «Машинное обучение и социальны компьютинг) рассказала слушателям об основных методах работы с геоданными и продемонстрировала различные возможности изображения объектов на карте мира, страны, или района города с помощью R-библиотек. Ира показала техники работы с данными, которые позволяют не только проследить географию домов, ресторанов, гостиниц или других заведений, но и нанести на карту различные характеристики, связанные с их функционированием и оценками пользователей.
Далее Станислав Козлов (ОП «Логистика и управление цепями поставок», майнор «Обработка и анализ данных») представил результаты своей работы по оптимизации распределения транспортных направлений и объединению пунктов назначения в компании, которая занимается экспресс-доставкой. Участники семинара узнали, как с помощью Python можно учитывать искажения географической карты для кластеризации объектов. Станислав также рассказал о построении сети географических объектов, актуальных для его компании на территории России и о представлении такого типа анализа на карте.