TrueSkill: системы ранжирования
При оценке успешности команды часто применяется устаревшая модель Elo рейтинга, которая оценивает только победу или поражение, некорректно работает с ничьёй, а отдельных игроков в команде с неодинаковым опытом и разной спортивной формой игнорирует вовсе. На первом в 2018 году семинаре НУГ "Машинное обучение и социальный компьютинг" Александр Сироткин на примере игры "Что? Где? Когда?" рассказал о системе рейтинга TrueSkill, как её улучшить, если учесть больший вклад лидера и случаи, когда команда играла в неполном составе.
Александр Сироткин рассказал о Байесовском рейтинге, как вероятностной модели, когда рейтинг — линейно упорядоченный результат сравнения вероятностей выигрыша команд. Что на языке людей звучит как "у кого рейтинг больше, тот скорее выиграет". Затем на примере монетки разобрали, как посчитать Бета-распределение — математическое описания выпадения или орла, или решки, когда составлен прогноз. Также Александр Владимирович немного рассказал о плюсах и минусах рейтинга Elo (основной в шахматном спорте). Во-первых, для новых игроков рейтинг вручную подкручивают, чтобы быстрее оценить их навыки. Во-вторых, состояние, навыки или внешние факторы осознанно игнорируются, для упрощения модели. TrueSkill же такие факторы учитывает, так как его разработали для формирования равных случайных команд в онлайн игре Halo, ведь никто не любит постоянно проигрывать и ожидает от соперников игры своего уровня. Так навыки игрока считаются нормально распределёнными со средним навыком (ν) и случайными внешними факторами (σ) — вроде невкусного завтрака или испорченного настроения. Командный рейтинг от победы или поражения делится между игроками пропорционально участию и вкладу.
Так TrueSkill вычисляет истинный рейтинг каждого игрока, как части команды, но также применяется в интернет маркетинге, для оценки успешности контекстной рекламы. Системы рейтингования - довольно актуальная для НУГ. Андрей Шелопугин, например, в своей работе использует модель GLICKO, схожую с TrueSkill. Также, мы надеемся, что участники НУГ смогут применить TrueSkill в своих исследованиях, например, об онлайн-играх.
Отличный семинар! Благодаря умению Александра просто доноситься нетривиальные темы байсоевского вывода на семинаре удалось не только впервые познакомиться с основными моделями рейтингов, но и разобраться в их устройстве.
Белялов Ильдар Кафисович
Департамент прикладной математики и бизнес-информатики: Преподаватель