ГоБиблиотека: Рейтинг/Система/Проект

ПРОЕКТ РЕЙТИНГ-СИСТЕМЫ в первой редакции был принят к внедрению Президиумом РФГ(Б) летом 2003 г. Предлагаемая вторая редакция проекта рейтинг-системы (РС) представляет собой вариант, переработанный на основе использования результатов М.Гликмана.

Карта коневого раздела — РейтингКарта

Автор: Сергей Павлов

Оглавление документа


р(DR,D) – функция вероятности выигрыша в зависимости от разницы рейтингов обоих игроков: DR = R1R2, и среднего «расстояния партии» от точки привязки: D = [(3000 – R1)·(3000 – R2)]1/2;
Rрейтинг-коэффициент, числовая (вероятностная) оценка текущего уровня игры (перед пересчетом);
R' – конечный рейтинг-коэффициент (после пересчета);
d = 3000 – R – расстояние игрока по шкале рейтинга от единой точки привязки (от рейтинга идеального игрока);
ΔN – отклонение результата в набранных очках-победах от вероятностного прогноза;
S – «отклонение» рейтинга – стандартное (среднее квадратичное) отклонение;
S' – отклонение рейтинга после пересчета.
S* = d/4 – максимально допустимое в РС отклонение рейтинга.
Ф – традиционная фора в камнях;
H – «истинная» фора, вычисленная с учетом сдига на полкамня, т.е. H = Ф – 0.5;
h – фора, пересчитанная в пункты рейтинга, т.е. h = 100·H;
Kан – коэффициент аномальности;
N – число рейтинг-партий в рейтинговом периоде, по которым производится пересчет рейтинга данного игрока;
rj – результат партии (1 или 0) c j-тым соперником;
Bj – коэффициент влияния партии с игроком j на рейтинг данного игрока;
K – коэффициент динамичности игрока;
j=1,N {} – суммирование по индексу j величин, стоящих в скобках.



Каждый игрок, входящий в рейтинг-систему (РС), получает рейтинг-коэффициент R, оценивающий уровень игры (мастерства). Текущий рейтинг имеет точность, определяемую параметром S, оценивающим стандартное отклонение уровня игры с соответствующим 95% доверительным интервалом ±2S. То есть предполагается, что уровень игры каждого игрока есть нормально распределенная случайная величина с некоторым средним (математическое ожидание) и стандартным отклонением, для которых R (рейтинг) и S (стандартное отклонение) являются статистическими оценками, причем реальное значение уровня игры с вероятностью 95% накрывается интервалом ±2S, а середина доверительного интервала совпадает с R. Заметим также, что для доверительного интервала ±S доверительная вероятность равна 68%, а 50% доверительный интервал равен примерно ±2S/3 (это так называемое среднее отклонение Е = 0.675 S).

При регулярном участии в турнирах, учитываемых как рейтинговые, и при незначительных колебаниях рейтинга (низкая дисперсия) 95% доверительный интервал игрока (т.е. S) сокращается, т.е. точность рейтинга увеличивается. Доверительный интервал рейтинга игрока расширяется при длительном неучастии в турнирах или большой дисперсии результатов (нестабильная игра). Влияние игрока на рейтинг других игроков находится в прямой зависимости от достоверности его рейтинга (чем ниже достоверность и больше S, тем меньше влияние на рейтинг других).

При резком скачке результатов игрока (недостоверность рейтинга по «критерию аномальности») производится специальная корректировка рейтинга. Это делается для обеспечения динамичного отслеживания силы игры при быстром росте и уменьшения отрицательного влияния несоответствия рейтинга на других игроков ("корректировка аномального роста").

Рейтинг-система согласовывается с традиционной квалификационной системой кю-данов, для чего в ней предусматривается учет партий на форе. Учитываются любые партии на форе, в том числе и при несоответствии форы и разницы рейтингов партнеров, а шкала рейтинга имеет однородную структуру – разнице в один дан традиционной системы кю-данов соответствует 100 пунктов разницы рейтингов по всей лестнице разрядов.

Для привязки всей системы, обеспечения меньшего смещения общего рейтинга, регулярно делаются поправки, рассчитываемые по изменению рейтинга наиболее стабильных игроков (анкеров). Все параметры РС контролируются и уточняются на основе мониторинга РС с использованием современных методов статистической обработки экспериментальных данных.



Рейтинг каждого игрока пересчитывается один раз за рейтинговый период, который может составлять либо интервал времени, либо определенное число партий игрока, либо отдельный турнир или этап турнира. Перед каждым пересчетом должен быть определен рейтинг у всех участников, входящих в РС, и заданы доверительные интервалы. Рейтинги игроков, впервые участвующих в пересчете (новые члены РС) или показавших аномальные результаты, рассчитываются по специальной методике (см. ниже).

Для пересчета рейтинга игрока за один рейтинговый период используется общая формула Эло

R' = R + K ΔN,

где ΔN — приращение очков (побед) сверх ожидаемого (или недобор), т.е. расхождение результата и вероятностного прогноза, K — коэффициент динамичности игрока, вычисляемый по формуле Гликмана:

K = S*/[(S*/S)2 + DБ].

Здесь S* = d/4 — максимальное отклонение рейтинга, DБ — дисперсия, подобная рассеиванию в схеме Бернулли (около N/4 для наших турниров) и равная

DБ = ∑j=1,N {Bj2·Pj(1 – Pj)}.

Отклонение результата от вероятностного прогноза вычисляется по формуле

ΔN = ∑j=1,N {Bj·(rj – Pj)},

где Bj<=1 – коэффициенты «влияния» игроков, учитывающие неопределенность (отклонение) рейтинга и определяемые ниже, rj – результат партии (1 или 0) c j-тым соперником, j=1,...,N; вероятности побед Pj по формуле (Марк Гликман):

Pj = р(Bj·DRj,Dj),

где Dj – среднеквадратическое расстояние двух рейтингов от 3000 (см. ниже), DRj = R – Rj, а коэффициенты «влияния» определяются по формуле:

1/Bj2 = 1 + 3·[Sj/(3.141593·Sj*)]2.

Для функции вероятностей р(DR,D), на базе обработки статистических данных Европейской Го Федерации с использованием современных методов математической статистики, при рейтингах соперников R1, R2, получено следующее выражение:

р(DR,D) = 0.5 + DR/D,

где DR = R1R2, D = [0.5·((3000 – R1)2+(3000 – R2)2)]1/2.

Новое значение отклонения рейтинга после турнира S' вычисляется по формуле:

S' = (K·S*)1/2.

Для игроков, показывающих слишком большое расхождение между полученными и прогнозируемыми результатами в сторону увеличения, производится специальная коррекция входного рейтинга, описываемая ниже в отдельном пункте.



Важную роль в стабилизации РС, повышении точности рейтинга и устранении возможных деформаций играют рейтинговые турниры с гандикапом (форой), особенно при форе, максимально точно соответствующей разнице рейтингов. Если привычная фора «в камнях» – это Ф, то истинная фора равна Н = Ф – 0.5. Соответственно, она выравнивает разницу в рейтинге в 100·(Ф – 0.5) пунктов. Из этой формулы видно, что фора Ф = 1 (ход без коми) уравнивает разницу в 50 пунктов. В формулу разницы рейтингов, соответственно, добавляется h = – 100·Н (первый игрок дает фору второму, поэтому его сила уменьшается, в противном случае фора Н считается отрицательной):

DR = (R1 – h) – R2 = R1 – (R2 + h).

В РС предполагается, что фора нелинейно отражает разницу в уровне игры в данах и кю, но эта нелинейность не оказывает существенного влияния на стабилизирующую роль форовых турниров, так как на большой статистике вносимые ошибки (которые и так невелики) симметричны и гасятся за счет нормальности своих распределений (подтверждается статистическими данными).

При расчете соответствия форы и компенсации в очках (Коми) используется следующая аппроксимационная формула:

Коми = 7·(2Ф + a·Ф·(Ф – 1) – 1).

Эта формула выведена в предположении, что каждый новый камень форы усиливается ранее выставленными с некоторым постоянным коэффициентом a, который можно определить, например, из условия, что при 9-ти камнях форы эквивалентное число очков, выравнивающих шансы, примерно равно 140, и тогда:

a = 3/72,

то есть действительно нелинейность форы незначительна в большей части шкалы гандикапа. Для грубых прикидок и определения форы с точностью до полкамня можно пользоваться еще более простой формулой:

Коми = 8·(2·Ф – 1) = 16·Н.

Аппроксимационные формулы для Коми нужны организаторам турниров тогда, когда фора устанавливается максимально точно по разнице рейтингов – то есть используются не просто «камни форы», но и дополнительные очки Коми (как прямого, так и обратного: от белых – черным). В РС несоответствие форы и разницы рейтингов всегда учитывается с максимальной точность, какая бы система установки реальной форы ни применялась в турнире.



Достоверность рейтинга игрока в РС определяется стабильностью его выступлений, т.е. тем, насколько его результаты близки к прогнозируемым, и неопределенностью рейтинга, связанной с длительным неучастием в соревнованиях. Параметром, учитывающим достоверность рейтинга, является (при фиксированной доверительной вероятности 95%) ширина доверительного интервала, определяемая величиной отклонения S. Будем перед каждым пересчетом рейтинга корректировать достоверность аналогично Гликману (см. РС Глико) и перед турниром уточнять S по формуле:

S = St·[1 + (k·T)2]1/2,

где St – отклонение после последнего пересчета, T – время в месяцах, прошедшее с последнего турнира (исключая текущий месяц), k = 0.01·(d/St), d – расстояние до идеального игрока. Величина S «обрезается» так, чтобы быть не более установленного в РС максимального отклонения рейтинга S* = d/4, где d = 3000 – R. Таким образом, корректировка S зависит от двух характерных величин: срока последнего участия в турнирах и отношения расстояния до идеального игрока к отклонению рейтинга.



Если в турнире какой-либо игрок показывает результат в очках, отклоняющийся от ожидаемого на величину более некоторой критической величины ΔNан, зависящей от дисперсии схемы Бернулли и отклонений входных рейтингов игроков, то есть величина отклонения в турнирных очках

ΔN = ∑j=1,N {Bj·(rjPj)}

превосходит по модулю ΔNан, то входной рейтинг теряет доверие. Тогда необходимо учесть выявленную недостоверность рейтинга и снизить влияние результатов партий с «аномальными» игроками на рейтинг более стабильных игроков. Делается это за счет корректировки входного рейтинга аномального игрока (только при росте рейтинга) путем вычисления такого нового значения входного рейтинга, при котором полученный аномальный результат наиболее достоверен. Для этого сначала вычисляется Kан – коэффициент аномальности, определяемый просто через превышение ΔN над ΔNан по модулю:

Kан = |ΔN/ΔNан| – 1, но не более 1.

Таким образом, этот коэффициент неотрицателен и не превосходит 1, если игрок показывает «аномальные» результаты, а величина ΔNан рассчитывается по формуле:

ΔNан = 1.5 (DБmax + DS)1/2,

где первое слагаемое оценивается по максимальному значению дисперсии схемы Бернулли, т.е при N турах полагаем DБmax = N/4, а второе учитывает дисперсию, вносимую отклонениями рейтингов соперников:

DS = (S/d)2·∑j=1,N {(d/dj)[1 + (Sj/S)2]}.

Для всех игроков, показавших превышение очков над ожидаемыми по этому критерию, необходимо скорректировать входной рейтинг. Это учтет снижение их влияния на остальных игроков при окончательном пересчете по базисной схеме через более правильный учет вероятностей побед и поражений. Вся методика «аномальной коррекции» может быть представлена в виде двух шагов:

Шаг 1. Пусть Kан >0 (аномальный рост), тогда нужно вычислить Rан – значение «аномального» рейтинга – по методике «максимального правдоподобия». Для этого вычисляются dф и dср – сдвиги от 3000 рейтингов «усредненных» условного форового и просто среднего соперников (процедуры осреднения подробнее см. на странице Рейтинг/Система/Проект/Методика). Также вычисляется hср – форовый сдвиг (фактически средняя фора в очках рейтинга). Сдвиг dан от рейтинга в 3000 очков, соответствующий вычисляемому аномальному рейтингу, находится из решения уравнения

p = 0.5 + (dф – dан)/(dср·dан)1/2,

где
dср = 3000 – Rср = dф + hср — средний сдвиг рейтинга соперников от 3000,

Rф = Rср + hср — рейтинг условного «усредненного» форового соперника,

dф = 3000 – Rф — соответствующее расстояние до 3000,

p — наблюдаемый процент побед данного игрока.

Сделав замену: z = (dан)1/2, которая корректна, так как dан по смыслу всегда больше нуля, получим простое квадратное уравнение относительно z с единственным неотрицательным корнем и в результате найдем

dан = z2 = dср·{[(2p – 1)2/16 + dф/dср]1/2 – (2p – 1)/4}2,

Rан = 3000 – dан.

Иногда удобнее пользоваться эквивалентной формулой со средней «рейтинговой» форой hср:

dан = dср·{[(2p – 1)2/16 + 1 – hср/dср]1/2 – (2p – 1)/4}2.

Шаг 2. Вычисленный как описано выше аномальный рейтинг является новым значением входного рейтинга для тех положительно аномальных игроков, у которых Kан = 1, а для частично аномальных игроков (0 < Kан < 1) необходимо сделать интерполяцию по формуле:

R = R0 + (Kан)2·(RанR0),

где рейтинг с индексом «0» означает входное значения до корректировки.

Замечания.
  1. Про усреднение величин, в том числе при вычислении сдвигов рейтинга и средней форы, а также о других тонкостях расчетов по проекту, включая корректировку отклонения при аномальных результатах, читайте в Методических указаниях.
  2. В целях управления динамикой аномальной коррекции можно вводить понижающие коэффициенты при интерполяции рейтинга между старым входным рейтингом и новым аномальным значением. В действующей на данный момент РС (июнь 2005) понижение начинается с рейтинга 2000 и далее линейно снижается до нуля при приблиджении к идеальному игроку.


Каждому игроку, входящему в рейтинг-систему, должен быть присвоен рейтинг-коэффициент R и определен 95% доверительный интервал на основе вычисления отклонения S. Не входящие в РС игроки выступают в турнирах с условным рейтингом, назначаемым проводящей организацией с учетом пожеланий игрока и др. факторов. Такие игроки почти не влияют на рейтинг игроков из РС. Начальный «входной» рейтинг впервые вступающих в РС игроков для первого турнира или рейтигового периода вычисляется по методике «максимального правдоподобия», описанной в разделе выше для корректировки «входного» рейтинга при аномальном результате. При этом все расчеты осуществляются по всем партиям с участниками РС после того, как сделаны все корректировки, связанные с аномальными результатами. Входное отклонение S рассчитывается, поcле вычисления R из решения уравнения (4) во второй форме – со средней форой, и полагается равным S = d/4 – максимальному отклонению для данного рейтинга R. Затем процедура пересчета турнира завершается в соответствии с базисной схемой – полным пересчетом всех входных отклонений и рейтингов у участников турнира (или за рейтинговый период): как для обычных игроков, так и для аномалов и для впервые квалифицируемых в РС.

Если игрок, выступавший в турнире (или в другом рейтинговом периоде) с условным рейтингом, не возражает против включения его в РС, то по результатам турнира (по окончании рейтингового периода) ему могут быть присвоены рейтинг R и отклонение S в данной РС.



В некоторых турнирах бывает так, что игрок сыграл менее 4-х партий. В этом случае формальное применение понятия аномального результата может привести к курьезам, когда аномальным (частично) будет признан результат всего одной партии. Поскольку само понятие аномальности вытекает из статистических критериев проверки гипотез, то надо учесть, что слишком малые выборки (менее 4-х партий) бессмысленно использовать в таких критериях. Следовательно, при числе партий менее 4-х аномального результата не может быть в принципе, и это не допускается в проекте РС.

Аналогично, учитывать на 100% рекомендации по начальному присвоению, исходя только из принципа максимума правдоподобия, при малом числе партий также не следует. Поэтому предлагается, при первом входе в РС рассматривать экспертные оценки рейтинга с одновременным установлением достоверности – тоже экспертно, а также использовать следующий интерполяционный подход: при 100% результате и менее чем 6-ти партиях начальный «входной» для рейтингового периода рейтинг устанавливается как интерполяционное значение по числу партий – при одной партии берется рейтинг соперника (с форовым сдвигом), при 2-5 партиях соответственно по интерполяции между рекомендацией общего входа (т.е. Rан – см. пп.5-6) и средним рейтингом соперников с учетом форового сдвига.



Для обеспечения контроля за точностью РС, привязки групп игроков к равномерной и однородной шкале кю-данов необходимо проводить мониторинг РС. Кроме того, надо согласовывать РС с другими РС (европейской например). Одним из способов мониторинга является введение так называемых «анкеров», то есть игроков, показывающих наиболее стабильные и предсказуемые результаты, имеющих самый узкий доверительный интервал и активно играющих в турнирах. Если на основании специальной статистической обработки результатов выступления анкеров в турнирах за контрольный период времени выявляется смещение рейтинга по абсолютной шкале, привязанной к единой отметке в 3000 пунктов (идеальный игрок), то производится корректировка рейтинга всей совокупности участвующих в рейтинге игроков (см. также «Заключительные замечания»).

Принадлежность к группе анкеров устанавливается по предыдущему контрольному периоду до следующей контрольной отметки (период устанавливается рейтинг-комиссией, например – полгода). Получение игроком хотя бы частично аномального результата немедленно выводит его из группы анкеров.



Для быстрого приближенного расчета изменения рейтинга в турнирах, когда рейтинг достаточно достоверен у большинства игроков и нет аномальных результатов, можно воспользоваться упрощенными формулами. Суть упрощений состоит в том, что член типа «дисперсии Бернулли» заменяется на именно такую дисперсию, равную приближенно N/4, а коэффициенты влияния полагаются везде равными 1.

Расхождение результатов с точными формулами в большинстве случаев при ровном составе по достоверности рейтинга будет не более 1-2%. Для учета аномальных результатов можно воспользоваться тем же подходом, что и в общем случае, и корректировать R перед пересчетом, но с учетом введенных упрощений. Также и критерий аномальности можно при желании упростить, оставив там только дисперсию Бернулли. В остальном схема аномальной коррекции и схема входа в РС остаются прежними.



Выше в предыдущем пункте был затронут важный вопрос привязки РС, согласования РС из разных регионов, в разных национальных федерациях и т.д. Более того, возможна постановка вопроса о введении единого в мире рейтинга по игре Го. Последний раз такая попытка была сделана Алешом Чипли, который создал недавно сайт, где приводит результаты своих расчетов по ведущей группе профессиональных игроков. Но решение вопроса о едином мировом рейтинге невозможно без привязки всех рейтингов к одной точке отсчета, без перехода к использованию единой методики расчета, без решения ряда организационных проблем и технических вопросов по сбору и централизованной обработке информации.

Привязка к единой точке отсчета неразрывно связана с введением единой методики расчета и прежде всего – одинаковой функции вероятностей. Ряд РС (Эло, Томпсона и Гликмана) не имеют верхней границы рейтинга, другие – указывают на существование конкретного предельного значения (Чипли, данный проект). Существование верхнего предела для уровня игры не вызывает сомнения и поэтому необходимо переходить на новый проект, который не только имеет статистическое обоснование, но и позволяет указать вполне обоснованно единую точку отсчета – 10 дан, сохранить всю структуру традиционной квалификационной системы кю-данов и форовый принцип как основу стабилизации и привязки локальных рейтингов на базе единой линейной и однородной шкалы. Более того, наличие вполне определенной нелинейной зависимости вероятности от расстояния до точки отсчета дает возможность корректировать групповые рейтинги независимо друг от друга, сопоставляя статистические частоты с теоретическими значениями, даваемыми формулой вероятностей.

Рассмотрим группу анкеров, состоящую из игроков близкого уровня, скажем в среднем 5-го дана. В такой группе стабильных игроков можно определить среднестатистические частоты побед, соотнесенные со среднестатистическими разностями рейтингов. Тогда можно оценить смещение всей группы на единой шкале, так как частоты должны быть согласованы с формулой, задающей вероятности в зависимости от разницы рейтингов и от сдвига среднего рейтинга группы от точки отсчета. На основании выявленного расхождения и оценок достоверности можно корректировать рейтинг всей группы, причем делать это независимо в каждой локальной РС, даже если между ними нет межсистемных встреч. Получение конкретных расчетных формул для такой корректировки является технической задачей и не вызывает в принципе каких-либо затруднений (можно, например, обобщить формулу корректировки Эло или Гликмана). Например, пусть среднегрупповая частота побед более сильного составила 58% при среднегрупповой разнице рейтингов по этим же партиям в 42 очка. По формуле вероятностей находим, что это соответствует среднему расстоянию до единой точки отсчета 10 дан в 525 очков рейтинга, т.е. предполагаемый сдвиг составляет порядка 25 очков (от среднего рейтинга 2500, что соответствует среднему расстоянию от 10-го дана в 500 очков). Но в этом значении сдвига содержатся ошибки, связанные с процедурами осреднения, поэтому можно делать поправку с некоторым коэффициентом, меньшим единице, может быть зависящим от объема использованной выборки. Ну и так далее.

Кроме осуществления программной реализации описанного в проекте алгоритма, при внедрении новой РС необходимо также рассмотреть ряд организационно-методических вопросов: определение интервала пересчета рейтинга (раз в квартал, в месяц, после каждого турнира и т.п.); обеспечение своевременного учета в рейтинге прошедших турниров; согласование РС РФГ(Б) с рейтингом EGF и другими рейтинг-системами, выработка рекомендаций по рейтингу для единой спортивной классификации и т.д.

С учетом российского опыта и опыта других стран, международного опыта применения РС в Го, а также опыта применения РС типа Эло в шахматах, рекомендуется производить обсчет рейтинга после каждого турнира. Для обеспечения оперативности и простоты контроля ошибок предлагается создать на одном из го-сайтов интерактивную программу с базой данных по партиям и турнирам, доступ к которой будет возможен через интернет практически любому желающему посчитать рейтинг по РС РФГ(Б) для любого турнира. Обязанности по контролю за соблюдением дисциплины должны быть возложены на президиум РФГ(Б).

Также к данной группе организационно-методических вопросов следует отнести разработку и уточнение методик определения точности РС, мониторинга параметров, уточнения механизмов контроля и корректировки РС, проведение других специальных исследований. Данная задача ставится перед рейтинг-комиссией при президиуме РФГ(Б), осуществляющей свою деятельность на основании утвержденного положения и выпускающей регулярные рейтинг-листы и, по мере необходимости, информационные бюллетени.

В заключение еще раз отметим, что в результате введения новой РС будут прежде всего устранены те причины, которые привели к отрицательным явлениям, отмеченным при анализе ситуации в российском рейтинге. Если при этом будет произведена коррекция текущего рейтинга с учетом имеющихся деформаций, то новая РС должна оказаться согласованной с европейским рейтингом, причем по крайней мере не хуже, чем применяемая в настоящее время. Благодаря выявленным фундаментальным закономерностям в распределении вероятностей не только открылась возможность использовать единую точку отсчета для всех применяемых в мире Го РС, но и создана методологическая база построения в перспективе единой РС, объединяющей как любителей, так и профессионалов во всем мире. И первый шаг в этом направлении должен заключаться во внедрении новой идеологии расчета рейтинга в России и затем – в европейской практике.


  1. Доклад по проекту рейтинг-системы на I Чемпионате СССР по Го в Ленинграде (январь 1990 г.).
  2. Доклад А.Чипли по рейтинг-системе ЕГФ на конференции по проблемам Бадук в Сеуле (май 2001 г.).
  3. Официальный сайт ЕГФ (http://www.european-go.org/rating/gor.html).
  4. Официальный сайт АГА (http://www.usgo.org/aga/clocks.asp).
  5. Официальный сайт РФГ(Б) (http://go.aspec.ru).
  6. Страница по рейтинг-системам на сайте http://Sibgo.narod.ru (http://Sibgo.narod.ru/rating.html).
  7. Материал «Рейтинг Джеффа Сонаса лучше, чем Эло?» и дискуссия по статье Сонаса на странице по шахматному рейтингу – был представлен на сайте (http://www.worldchessrating.ru/themes/basic/conferences-theme-view.asp?folder=51&pg=1&topic=151)
  8. Система рейтингования Глико – источник: (http://renju.gambler.ru/tournirs/?page=gliko).