• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Социальная информатика: соцсети против ученых

Недавно в Питерской Вышке завершилась 10 международная конференция Social Informatics 2018. Она прошла в России впервые и привлекла ученых из трех десятков стран. Участники представили результаты свежих исследований в области социальной информатики, а самыми горячими темами стали фейковые новости и доступ к персональным данным в интернете.

Социальная информатика: соцсети против ученых


Социальная информатика — достаточно молодая область исследований. В современном виде она существует около десяти лет, но за эти годы направление достигло небывалого уровня развития. Это междисциплинарная область, в которой предпринимаются попытки использовать большие данные и сложные алгоритмы для решения задач из социальных наук. С помощью информационных технологий исследователи моделируют социальные процессы, такие как поведение пользователей в интернете или распространение информации по сети.

Social Informatics является ведущей международной площадкой для обмена опытом и презентации исследований в области социальной информатики. В Петербурге собрались ученые из 28 стран: от Чили и США до Австралии и Сингапура. Всего на конференции было представлено 30 полных и 32 постерных доклада, каждый из которых прошел проверку тремя рецензентами.

Мы боролись за право проведения Social Informatics 2018 в Питерской Вышке. Подавали серьезную заявку в организационный комитет конференции, где рассказывали о нашем опыте и концепции будущего мероприятия. Очень обрадовались, когда местом проведения десятой, юбилейной конференции был выбран Петербург. В прошлом году SocInfo проходила в Оксфорде, и мы ездили в Великобританию с докладом, чтобы, во-первых, представить там российское исследование, а во-вторых, посмотреть на организацию и перенять опыт.

Кольцова Елена Юрьевна
Лаборатория интернет-исследований: Заведующий лабораторией

Скандал с Cambridge Analytica

На SocInfo 2018 обсудили анализ социальных медиа, новые модели вычислительной социальной науки и поведение пользователей в соцсетях. Самыми горячими темами оказались фейковые новости и проблема приватности личных данных, о которой заговорили после скандала с Cambridge Analytica. В последние годы этот вопрос встал очень остро: полное сокрытие персональных данных, к которому стремятся социальные сети, противоречит сути социальной информатики — использованию большого объема информации для получения нетривиальных результатов.

Сегодня в социальной информатике сложилась ситуация, когда исследователи из разных стран имеют неравные возможности для работы. Хуже всего приходится ученым из США и других западных стран. Большинство американцев и европейцев пользуются Facebook для общения с друзьями и коллегами, а значит социальная сеть знает о своих пользователях практически все. После вмешательства компании Cambridge Analytica в выборы американского президента 2016 года, Facebook изменил условия для сбора личной информации в исследовательских целях. Ученые жалуются, что теперь согласовать свою работу с соцсетью и получить разрешение на сбор данных стало практически нереально.

Чтобы хоть как-то поддержать ученых, руководство Facebook запустило специальную программу доступа к персональным данным для исследовательских целей. Однако существует целый ряд ограничений. Во-первых, было определено всего две тематики для исследований — это упомянутые выше фейковые новости и вмешательство в выборы президента США. Во-вторых, команда Facebook сама формирует датасеты и передает ученым определенный набор данных, который нельзя расширить или уточнить. Ну а в-третьих, доступ к этим данным получили не все заинтересованные исследовательские группы, а только те, что были отобраны независимым экспертным комитетом.

Я вижу серьезную проблему с доступом к персональным данным в социальных сетях. По мере того, как соцсети ограничивают возможности получения информации через программный интерфейс приложений (API), некоторые мои коллеги считают, что мы должны работать в мире «пост-API». Они предлагают напрямую собирать данные с веб-сайтов социальных сетей, тем самым нарушая условия компаний по оказанию услуг. Я не согласен с этой позицией, но обеспокоен, что мы движемся к ситуации, когда независимые исследователи не смогут изучать поведение пользователей в социальных сетях, а единственными людьми, имеющими доступ к этим данным, станут маркетологи и аффилированными или " одобренные" компаниями исследователи.

Роберт Акланд
профессор Школы социологии и Центра социальных исследований и методов Австралийского национального университета

Таким образом, западные ученые оказались в непростой ситуации. Вместо Facebook они вынуждены исследовать Twitter, Instagram и LinkedIn, но аудитория этих социальных сетей значительно меньше.

Перспективы — в России

В отличие от иностранных исследователей, у российских ученых пока нет проблем с данными. Крупнейшая в России социальная сеть “Вконтакте” свободно предоставляет доступ ко всем незакрытым аккаунтам. Этой возможностью пользуются не только во имя науки, но и в коммерческих целях, например, для скоринга. Скоринговые системы помогают банкам и микрофинансовым организациям оценивать кредитоспособность потенциальных клиентов. Коммерческие интересы компании “Вконтакте” при этом не учитываются, поэтому в ближайшее время соцсеть собирается последовать западному примеру и ужесточить доступ к персональным данным своих пользователей.

Если мы хотим добиться какого-то общественного блага, нам совершенно необходима государственная политика в области доступа к персональным данным. Мы должны придумать систему, в которой исследовательское сообщество будет получать необходимую информацию, даже если держатели этих данных не заинтересованы в их раскрытии. Зачем социальным сетям, банкам или провайдерам мобильного интернета делиться информацией? У них нет никакого коммерческого интереса. Но эти данные могут быть очень и очень полезными для решения общественно важных задач. Если придумать стимул для компаний, то учитывая ситуацию на западе, мы можем совершить прорыв в социальной информатике. Например, во многих зарубежных странах крайне трудно получить данные, связанные со здоровьем граждан. Если мы поступим умнее и гибче, то на своих данных сможем совершить открытие, которое там попросту невозможно.

Кольцова Елена Юрьевна
Лаборатория интернет-исследований: Заведующий лабораторией