• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
17
Апрель

Новый курс: Социальная физика

В следующем году на нашей программе появятся два трека (направления): «Cоциальный анализ молодежи» и «Аналитика социальных данных».  Начинаем знакомить вас с преподавателями и курсами, которые ожидают студентов в следующем году.

Трек:Аналитика социальных данных (подробнее о треках)

Курс:Предиктивные теории поведения, социальная физика и управление социальными системами (преподается на английском языке)

Преподаватель:Кольцов Сергей Николаевич

 

О преподавателе

По первому образованию я физик-теоретик, работал в Академии Наук и закончил питерский физфак в области вычислительной физики. Специализировался на применении вычислительных моделей для решения конкретных задач.. А по второму образованию - социолог, закончил Европейский Университет, где в качественной методологии исследовал, как генерируются знания физики в разных странах. Я кандидат физико-математических наук и кандидат социологических наук

О новом курсе

Курс, который я читаю, для краткости назовем «Социофизикой». Его появление связано с тем, что сейчас происходит некая реинкарнация применения математических методов для исследования социальной жизни. Идея была предложена еще Огюстом Контом, но на тот момент она не прижилась, потому что построить социологию по аналогии с физикой, математикой или химией не получилось – во-первых, в силу недостатка данных, во-вторых – потому что непонятно было, как их измерять. В последнее время, когда появились социальные сети и огромное количество данных, мы уже можем строить такого рода модели. И эти модели будут отличаться – и они отличаются – от традиционной статистики, которая преподавалась в рамках социологического образования. Почему это называется именно социофизикой? Дело в том, что многие модели, которые развиваются в рамках этого направления, активно используются в физике. Простой пример – это исследования социальных сетей: та математика, которая заложена внутри этого направления, по большому счету не связана со статистикой в привычном смысле. Там нет нормальных распределений, соответственно, вся математика совершенно другая, там необходимо использовать всевозможные процедуры сэмплирования. Это нужно рассказывать студентов и их обучать.

Кроме того, данных теперь очень много – есть возможность собирать, к примеру, телевизионные каналы, информацию о том, как генерируется информация, как распространяются новости. Вокруг нас существует информационно-политическое, социальное поле, которое теперь можно измерить, и вычислить его эффекты на людей. И речь уже не идет о локальных группах, которые можно проинтервьюировать, мы говорим уже о сотнях тысяч человек. Мы попадаем в так называемую мезоскопическую область и этих частиц, если считать каждого человека за живую частицу, становится много. Поведение толпы, влияние пропаганды посредством телевидения или новостей в интернете – это все позволяет использовать прямые аналогии из физики. Именно поэтому курс называется именно так. Подобные курсы сейчас появляются во многих крупных университетах – к примеру, в MIT есть целая лаборатория – MediaLab, которая занимается непосредственно этим направлением.

Что нужно для того, чтобы изучать социофизику?

Для прохождения данного курса нужна определенная подготовка в сфере математики - необходимо знать, что такое дифференциальное исчисление, интегральное исчисление, производные интеграла. Необходимы знания линейной алгебры. Особенно интересно должно быть тем, кто меняет специализацию – например, из каких-то технических областей переходят к машинному обучению. Но важно понимать, что социофизика не является другим названием машинного обучения, которое построено на принципах уже маркированных данных. Социофизика – иная вещь, она включает в себя машинное обучение, но по-другому. В ней строятся теоретические концепты, которые восполняют социальные теории, но данные в ней не маркированы.

Кроме того, необходимо либо знать, либо хотеть научиться програмированнию. Мы не требуем глубинного понимания того, как рассчитываются произведения матрицы или что-то в этом роде – но нужно пользоваться готовыми пакетами в R, Orange или Python. Необходим аналитический склад ума.

Примеры практического применения социофизики

В экспериментах было обнаружено явление, которое называется Echo Chamber – это когда люди группируются по сходным политическим взглядам. Но в рамках социологической теории непонятно, как объяснить этот эффект. С помощью социофизики можно построить теоретическую концепцию на основе кластеризации – как с магнитным полем, когда все спины кластеризуются в одно направление. Таким образом, мы можем сделать что-то за пределами экспериментальных данных. Можно найти алгоритмы работы с этими людьми. Вот у нас есть Echo Chamber ВИЧ-диссидентов – что с ними делать? Если есть понимание того, как оно сформировалось, то мы можем дальше работать с этим явлением.

О Лаборатории интернет-исследований

Современный мир не описывается одним набором знаний и компетенций, поэтому наша лаборатория создавалась как междисциплинарная – это место, где люди с разными компетенциями дополняют друг друга. Все наши идеи, наши проекты – они междисциплинарны. Один из последних таких проектов – это работа с тематическим моделированием, где мы анализируем большие данные социальных сетей и новостных потоков, и вычленяем отдельные темы. А затем выясняем, почему и как они возникают, почему какие-то из них становятся популярными, а какие-то – затухают. Задача в чистом виде социологическая – что люди обсуждают и почему? Но для работы требуются специальные алгоритмы из физики. Тематическое моделирование – как раз один из случаев, когда алгоритм, связанный со случайным блужданием используется для выделения тем.

Еще один из проектов – исследования этничности. Как люди обсуждают этничность, в каких регионах – здесь тоже работает тематическое моделирование, кластерный анализ, методы машинного обучения в виде классификаторов.

Третье направление – сентимент-анализ. Тот сентимент-анализ, который используется при исследованиях товаров и услуг не годится для изучения сленга в социальных сетях. Поэтому необходимы специальные словари, специальная методика, её валидизация. Причем процесс валидизации с одной стороны связан с социальными особенностями, а с другой – с особенностями алгоритма. Именно смесь наших компетенции помогает нам двигаться дальше.

Что почитать о социофизике?

Я рекомендую начать с трех обзорных статей Ю. Л.Словохотова – он ведет семинар по социофизике в Москве. Статьи раскрывают разные направления социофизики – сети, политический анализ, анализ временных рядов, и так далее. В его текстах также можно найти множество ссылок на другие полезные и интересные материалы.