Рейтинговая система Glicko - Glicko rating system

В Рейтинговая система Glicko и Рейтинговая система Глико-2 - это методы оценки силы игрока в играх на ловкость, например шахматы и Идти. Он был изобретен Марком Гликманом как усовершенствование Система рейтинга Эло, и изначально предназначался для основного использования в качестве шахматная рейтинговая система. Основным вкладом Гликмана в оценку является «рейтинг надежности», называемый RD, для рейтинги отклонение.

И рейтинговые системы Glicko, и Glicko-2 являются общественным достоянием и реализованы на игровые серверы онлайн (нравится Покемон Showdown, Личинка, Бесплатный шахматный сервер в Интернете, Chess.com, Онлайн-сервер Go (OGS),[1] Counter Strike: глобальное наступление, Team Fortress 2, Dota Underlords, Guild Wars 2,[2] Splatoon 2, и Dominion Online ), соревнования по программированию. Формулы, используемые для систем, можно найти на веб-сайте Glicko.

RD измеряет точность рейтинга игрока, при этом один RD равен одному стандартному отклонению. Например, игрок с рейтингом 1500 и RD 50 имеет реальную силу от 1400 до 1600 (два стандартных отклонения от 1500) с достоверностью 95%. Дважды RD добавляется и вычитается из их рейтинга для расчета этого диапазона. После игры величина изменения рейтинга зависит от RD: изменение меньше, когда RD игрока низкое (поскольку его рейтинг уже считается точным), а также когда RD его оппонента высок (поскольку истинный рейтинг противника не равен хорошо известно, поэтому информации собирается мало). Само значение RD уменьшается после игры, но оно будет медленно увеличиваться со временем бездействия.

Система рейтингов Glicko-2 улучшает рейтинговую систему Glicko и дополнительно вводит волатильность рейтинга σ.[3] Слегка модифицированная версия рейтинговой системы Glicko-2 реализована Австралийская шахматная федерация.[4]

Алгоритм

Шаг 1. Определите RD

Новое отклонение рейтингов () определяется с использованием старого отклонения рейтинга ():

куда - это количество времени (рейтинговых периодов) с момента последнего соревнования, а «350» считается RD игрока без рейтинга. Если в течение одного рейтингового периода состоялось несколько игр, метод считает, что они произошли одновременно. Период оценки может составлять от нескольких месяцев до нескольких минут, в зависимости от того, как часто проводятся игры. Постоянная основан на неопределенности навыков игрока в течение определенного периода времени. Его можно получить на основе тщательного анализа данных или оценить, учитывая время, которое должно пройти, прежде чем отклонение рейтинга игрока вырастет до уровня игрока без рейтинга. Если предположить, что потребуется 100 рейтинговых периодов, чтобы отклонение рейтинга игрока вернулось к исходной неопределенности 350, а типичный игрок имеет отклонение рейтинга 50, то константу можно найти, решив за .[5]

Или же

Шаг 2: Определите новый рейтинг

Новые рейтинги после серии m игр определяются по следующему уравнению:

куда:

представляет собой рейтинги отдельных противников.

представляет собой результат отдельных игр. Победа - 1, ничья - , а убыток равен 0.

Шаг 3. Определите новое отклонение рейтингов

Функция предыдущего расчета RD заключалась в том, чтобы соответствующим образом увеличить RD, чтобы учесть возрастающую неопределенность в уровне навыков игрока в период отсутствия наблюдения со стороны модели. Теперь РД обновляется (уменьшается) после серии игр:

Смотрите также

Рекомендации

  1. ^ «У OGS новая рейтинговая система на основе Glicko-2!». Получено 2020-04-19.
  2. ^ Джастин, О'Делл. «В поисках идеального совпадения». Получено 16 января 2015.
  3. ^ Гликман, Марк Э. (30 ноября 2013 г.). «Пример системы Глико-2» (PDF). Glicko.net. Получено 27 января, 2020.
  4. ^ «Устав Австралийской шахматной федерации» (PDF). Получено 17 января 2019.
  5. ^ http://www.glicko.net/glicko.html

внешняя ссылка