Ещё о классификации популярной музыки: что такое “похожие исполнители”
Популярной музыки чудовищно много. Интерес к ней давно уже стал фактором, формирующим круги общения. Люди общаются на почве музыкальных пристрастий и в режиме онлайн: есть спрос на социальные сети, где единицей обмена является музыкальное произведение, а пользователи объединяются по признаку общих музыкальных вкусов. Существуют сервисы, производящие запись информации о прослушанных треках, в их числе Pandora, Last.fm, Prostopleer и многие другие. С их помощью также удобно находить новую музыку – программа может “посоветовать” то, что она считает похожим на запрос пользователя. Вот о том, что такое “похожие исполнители” по версии last.fm, и поговорим.
Популярной музыки чудовищно много. Интерес к ней давно уже стал фактором, формирующим круги общения. Люди общаются на почве музыкальных пристрастий и в режиме онлайн: есть спрос на социальные сети, где единицей обмена является музыкальное произведение, а пользователи объединяются по признаку общих музыкальных вкусов. Существуют сервисы, производящие запись информации о прослушанных треках, в их числе Pandora, Last.fm, Prostopleer и многие другие. С их помощью также удобно находить новую музыку – программа может “посоветовать” то, что она считает похожим на запрос пользователя. Вот о том, что такое “похожие исполнители” по версии last.fm, и поговорим.
Проект Last.fm – это симбиоз одноименного интернет-радио и программы Audioscrobbler, записывающей информацию о том, какую музыку слушают пользователи. Симбиоз этих двух проектов был обусловлен отчасти и тем, что обе системы работают по одному и тому же принципу: они настраиваются самими пользователями в соответствии с индивидуальными требованиями. Кнопки “нравится” и “бан” в интернет-радио позволяют отсеивать музыкальную информацию, выявляя таким образом музыкальный вкус пользователя. А запись информации на last.fm (обозначаемая термином scrobbling, “скробблинг”) работает как раз в обратную сторону: вкус пользователя формируется с помощью накопления информации о прослушиваемом, а не путём фильтрования.
В данном случае меня интересует механизм работы Audioscrobbler, а точнее, то, как устроена база данных, создаваемая этой самообучающейся системой. Один из вариантов коммуникации пользователя и системы last.fm состоит в том, что слушатели сами присваивают тэги (ассоциативные метки) исполнителям. Потом эти тэги каким-то образом обрабатываются, и появляются облака тэгов, согласно которым музыкальные исполнители объединяются в некоторые сети, деревья. В результате вся система представляет собой гигантский граф, и становится возможным определение подобия. Какие же исполнители определяются программой как “похожие”?
Как правило, когда слушатель говорит о “похожей музыке”, он имеет в виду музыку одного стиля. Широта понимания стиля, разумеется, варьируется от человека к человеку. Облака тэгов, появляющиеся в результате того, что всё больше и больше пользователей присваивают музыке некоторое стилевое обозначение, напоминают воронки. Крупные (и зачастую бесполезные, типа female vocalists или russian) засасывают более мелкие, уточняющие, а также кадавры из слов, нацеленные на более точное определение, но не справляющиеся со своей задачей. Но масса действий пользователей выявляет несколько средних значений, которые выводятся в списке тэгов первыми, и уже ими далее руководствуются слушатели при поиске новой музыки. Таков механизм обмена данными между системой и пользователями.
Особый звуковой образ творчества определённого исполнителя кроется именно в пазле, имя которому стиль. Однако часто возникают ситуации подобия, не относящегося к стилю. И это вызывает у меня, как у стороннего наблюдателя, некоторое недоумение. Музыка этих двух исполнителей совершенно не похожа, однако система утверждает обратное! Где ошибка?
Дело в том, что особенность системы сама допускает эту ошибку. К примеру, частенько встречается ситуация, когда в двух коллективах играет один и тот же музыкант, и тогда они опознаются системой как похожие – в результате того, что множество пользователей отнесли их к одной категории, например, для своего личного удобства. К примеру, у вокалиста и гитариста Opeth Микаэла Окерфельдта есть сайд-проект Bloodbath. 50% любителям Opeth этот проект не понравится, поскольку, в отличие от Opeth, это чистейший дэт-метал, в котором нет ни грамма опетовской лирики. Если пользоваться очевидным критерием стиля, то тут нет практически никакого подобия, по крайней мере, на уровне средних значений. Но если один и тот же музыкант специализируется на одном стиле и очень узнаваем, то цепочка подобия выглядит более логичной: сравнить хотя бы Porcupine Tree, Blackfield и сольное творчество Стивена Уилсона.
Иногда в топе тэгов оказывается страна производства (или язык исполнения). Тэг russian (hungarian, south african, etc.) портит картину, выдавая ассоциации с артистами, которые ничем не похожи на исходный запрос, кроме как гражданством. Плохо обстоит дело с локальными артистами ещё и потому, что за состоянием этой части базы данных почти никто не следит. Администрация сервиса не уделяет ей достаточного внимания, и в результате в “похожих исполнителях” может показываться всё что угодно, в том числе и другие варианты написания имени исполнителя. К тому же у исполнителей, известных преимущественно на локальной сцене, меньше прослушиваний, соответственно, меньше пользователей, которые коллективно могут изменить ситуацию в базе данных. К счастью, с годами граф российской музыкальной сцены в last.fm начинает выглядеть всё лучше и упорядоченнее, прослушивания накапливаются, а ассоциации становятся чётче.
Любая самообучающаяся система, зависящая от человеческого фактора, обречена на ошибки. Если цель last.fm – не только обеспечить общение пользователей между собой, но и построение некоторой структуры по мотивам мировой музыкальной сцены, то без администраторов этому сервису не обойтись.
Ася Воронкова
Иллюстрация: http://deathsyth02x.deviantart.com