ГоБиблиотека: Рейтинг/РФГ

Это старая версия Рейтинг/РФГ за 2008-09-30 01:52:32..
Раздел по российскому рейтингу, его истории и текущему состоянию.

Го (ГоКарта) => Го/Методики => Го/Методики/Рейтинг, РейтингКарта

Оглавление документа



По материалам доклада, подготовленного
расширенным составом РК для Президиума РФГ

«Статистика знает все» – к/ф «Служебный роман», реж. Э.Рязанов

Игра го обладает уникальным свойством, отличающим ее от всех других распространенных интеллектуальных игр: здесь широко применяется форовый принцип (или «принцип гандикапа»), позволяющий очень точно выравнивать шансы в играх между соперниками разного уровня мастерства. Такая особенность игры го очень важна в статистических расчетах, связанных с уточнением параметров рейтинг-систем (РС).

В любых единоборствах парные сопоставления (игры или партии) между участниками РС служат статистической базой для расчета рейтингов. При этом более сильный соперник побеждает чаще, априорная вероятность его победы в партии больше 0.5 и задается определенной функцией вероятностей, постулируемой в РС. На основе результатов множества партий все игроки распределяются с помощью заданного алгоритма РС в виде ранжировки по некоторому числовому параметру ("рейтинг-коэффициенту" или просто – «рейтингу»). Шкала рейтингов в той или иной РС является достаточно условной и можно вводить бесконечно много шкал и РС, которые будут давать примерно адекватные ранжировки, т.е. с достаточно правдоподобными соотношениями «силы игры», выражаемыми числовыми рейтинг-коэффициентами. Однако РС, позволяющие всех расставить в единой шкале независимо от того, насколько часто играются партии меду представителями разных регионов и клубов, практически не существуют в большинстве игр, за исключением игры го именно за счет использования в ней форового принципа.

Как же на практике принцип гандикапа позволяет построить единую универсальную шкалу в го? Фора реализуется в виде выставления более слабым соперником ряда камней на доску перед началом партии. Фактически это означает определенное преимущество, предоставляемое данной стороне за счет нескольких ходов «вперед». Так как результат игры определяется числом набранных каждой стороной очков и любой «правильный» ход в начале партии также оценивается определенным числом очков, примерно (в среднем) одинаковым для оптимальной игры при первых 10-15 ходах, то число камней форы может служить ориентиром для построения грубой шкалы «рангов», предположительно однородной и линейной. Если задать начальный фиксированный ранг какому-то одному стабильному игроку ("анкеру"), то за счет форовых игр с ним можно ранжировать сначала всех близких по уровню мастерства к даному анкеру, а затем и остальных участников – через форовые игры с уже ранжированными игроками. Такая шкала используется в го с давних времен и единственная в этом случае проблема – привязка шкалы к какой-то единой точке отсчета. Обычно сильнейшие профессиональные игроки Востока получают ранг 9 дан, затем к ним привязываются другие профессиональные игроки и сильнейшие любители – с шагом в один ранг вниз вплоть до 1-го дана, потом остальные более слабые – по шкале от 1 кю (на один ранг ниже 1-го дана) и далее в принципе неограниченно вниз с ростом ступеней кю. Сегодня в Японии и в большинстве других стран используется обычно 20 ступеней кю.

Под однородностью шкалы кю-данов понимается то, что преимущество в очках результата партии, определяемое форой, не зависит от расположения игроков на фиксированной шкале, а линейность означает одинаковый прирост очкового преимущества с ростом числа камней форы. Если постулировать линейность и однородность шкалы кю-данов и задать определенное число пунктов рейтинга на один ранг (обычно 100 пунктов), то можно получить числовую шкалу рейтингов с мелким шагом в один пункт (1/100 ранга), привязанную к сильнейшим профессионалам, в которой каждому рангу будет в среднем соответствовать целое число, кратное с множителем 100 номеру ранга. Такая шкала должна иметь точку отсчета, т.е. некоторый фиксированный сдвиг, определяемый условным максимальным значением, приписываемым виртуальному игроку, который никому не проигрывает. Предполагается, что такой «идеальный игрок» (сокр. «ИИ») не совершает ошибок в ходе партии, т.к. обаладает оптимальной стратегией, а такая стратегия всегда существуюет для игр типа го, что доказывается математическими методами. На основе описанного подхода и строятся сегодня рейтинговые шкалы и РС, используемые в разных национальных федерациях и международных организациях по игре го.

Итак, при построении современной РС в го, базирующейся на форовом принципе, требуется ответить на следующие вопросы:
– каково преимущество в результате партии, которое получают черные за счет права первого хода (величина «коми»);
– какова величина шага шкалы в пунктах рейтинга, соответствующая увеличению форы на один камень, и как шаг шкалы рейтинга связан с величиной коми;
– как выбрать точку отсчета шкалы рангов и согласовано с ней точку отсчета рейтингов;
– как выбрать для РС функцию вероятностей, зависящую от разницы рейтингов, уровней игроков и может быть других параметров, например характеризующих стабильность выступления того или иного участника РС в турнирах;
– как учитывать при расчете априорных вероятностей исходов партий принцип гандикапа;
– что считать «рейтинговым событием» и как выбирать интервал пересчета рейтингов ("рейтинговый период", соответствующий одному рейтинговому событию);
– какой выбрать алгоритм пересчета рейтингов по итогам рейтингового сыбытия;
– как задавать в РС стартовые рейтинги новым участникам и как компенсировать в алгоритме РС отток рейтинга от стабильных игроков к прогрессирующим;
– по каким критериям оценивать качество РС и как оптимизировать параметры.

Все выше перечисленные вопросы решаются на основе статистического анализа на больших выбрках партий с привлечением современных методов теории вероятностей и прикладной математической статистики, в том числе с проведением при необходимости численных экспериментов, моделирующих поведение конструируемой РС во времени. Часть из обозначенных проблем рассматриваются в последующих разделах, а некоторые, имеющие алгоритмический характер, изложены в описании РС РФГ(Б).


Коми в равных партиях стало использоваться относительно недавно – только после образования Японской Ассоциации го ("Нихон-Киин") в 20-х годах прошлого века. Первоначально размер коми был принят в 4.5 очка и с таким коми играли вплоть до конца 70-х годов. Пол-очка являются условной величиной для определения победителя при равном счете очков.

Однако статистика равных партий между профессионалами Японии показала, что такое коми является недостаточной компенсацией белым и размер коми был увеличен до 5.5 очков. В 80-х годах в Японии неоднократно публиковалась статистика игр с новым коми, в соответствии с которой черные побеждали примерно в 60% партий. Теоретико-вероятностный анализ при некоторых предположениях о распределениях силы игры профессионалов дает для ошибки определения величины коми оценку примерно в 2-3 очка. Поэтому в 90-х годах постепенно перешли на коми 6.5 очка, а в некоторых турнирах сегодня уже применяется коми в 7.5 очка. В РФГ(Б), как и в большинстве национальных и международных организаций по игре го, в настоящее время принято коми в 6.5 очка.

Шаг рейтинговой шкалы не имеет существенного значения – важно только, чтобы он обеспечивал необходимую точность ранжировки игрооков. Обычно он выбирается кратным 100 и в большистве РС принята шкала 100 пунктов на ранг (кю или дан). Нестабильность силы игры и, соответственно, отклонений рейтинга обычно имеют порядок от нескольких десятков пунктов (доли ранга) для уровня данов до нескольких сот пунктов (2-3 ранга) – для нижних кю. Поэтому шкала с шагом в 100 пунктов на ранг имеет достаточно мелкую «цену деления», чтобы обеспечить адекватную оценку уровня игры по рейтингу.


Со времен А.Эло, который начал свои исследования по РС в 60-х года прошлого века, принято шкалу рейтинга для логических игр типа шахмат, шашек или го брать в диапазоне 0-3000 пунктов. Выбор максимальной точки отсчета не имеет существенного значения – можно взять для этой отметки шкалы любое другое число, например 4000 или еще какое подходящее значение. Главная цель любой РС – ранжировка участников по силе игры относительно друг друга, а сдвиг шкалы не меняет ранжировку. В частности, шкала может быть и неограничена сверху или снизу.

Однако для логических игр двух лиц с полной информацией, к которым относятся шахматы, шашки, го и многие другие игры, справедлива теорема о существовании оптимальной стратегии. Игрок, обладающий такой стратегией (идеальный игрок, сокр. ИИ), не совершает ошибок и при равных стартовых условиях в партии не может проиграть. С другой стороны, реальные игроки совершают ошибки и результат партии определяется тем, кто меньше суммарно совершит ошибок (с учетом их значимости). В играх с качественным исходом партии (мат в шахматах, уничтожение материала соперника в шашках) не имеет особого значения, какой рейтинг приписать ИИ, в том числе его можно принять и бесконечно большим.

В го результат партии определяется очками, набранными соперниками, и ИИ должен набирать максимально возможную сумму, которая может в практических целях считаться ограниченной сверху, в то время как реальный игрок совершает ошибки почти при каждом из 120–150 ходов в партии. Результат партии в го, таким образом, определяется разницей набранных очков, вернее разницей суммарно сделанных соперниками ошибок, и каждый ход или его ошибочность могут теоретически быть оценены также в очках результата. При этом результат всегда конечен, а шкала рейтингов, согласованная со шкалой рангов, имеет также конечные оценки по разнице набираемых соперниками очков. Известно также, что с ростом мастерства уровень и частота совершаемых при отдельных ходах ошибок в среднем снижаются, а у ИИ уровень ошибок всегда равен 0. Поэтому правдоподобным выглядит предположение о конечности рейтинга ИИ, а рейтинг реальных игроков может неограниченно приближаться к этой отметке, никогда ее не достигая. Т.е. рейтинг ИИ должен быть конечным и являться асимптотическим значением на шкале рейтингов.

Исходя из выше изложенного, необходимо при построении РС для го после определения шага шкалы выбрать отметку, которая будет соответствовать рейтингу ИИ. Можно назначить такую точку отсчета произвольно, но можно исходить и из существующих ранжировок игроков и подбирать адекватное значение рейтинга ИИ на основе анализа статистических данных. Именно так и поступили в ЕГФ в 1998 году, когда приняли РС Чешской Ассоциации го (автор А.Чеплы). База партий ЕГФ содержала на тот момент более 100 000 партий, в том числе около 12% партий с гандикапом.


Какую РС в го, базирующуюся на форовом принципе, можно считать идеальной? Очевидно такая РС должна давать прогнозы результатов партий, незначительно отклоняющиеся от наблюдаемых частот побед/поражений, т.е. в среднем по всей шкале отклонения частот от прогнозов должны находиться в пределах статистической погрешности, а заданный шаг шкалы (у нас принято 100 пунктов на ранг) должен правильно отражать форовые соотношения между игроками, т.е. при точно выбранной по разнице рейтингов форе частоты должны сходиться к 50%. Обычно фора задается неточно (с недобором в пользу белых), поэтому частоты в форовых играх просто должны быть адекватны прогнозу, вычисленному по рейтинговой разнице между соперниками с учетом даваемой форы. Если играются в достаточном количестве форовые игры, то шкала в большей своей части сохраняет правильные форовые соотношения даже при неправильной формуле вероятностей, что подтверждается на статистике ЕГФ (12% форовых партий), где ведется мониторинг выполнения форовых соотношений, показывающий хорошее согласие с условием «100 пунктов рейтинга на один ранг», в то время как статистика равных партий показывает значительные расхождения частот от прогнозов (в некоторых случаях более 10%, что на статистике в тысячи партий в группах по рангам в несколько раз превышает допустимую статистическую погрешность).

В России в период с 1985 по 2005гг. практически не проводились форовые рейтинг-турниры. Коме того, формула вероятностей, принятая в РС-90, была выбрана на основе статистики равных игр 1-5 данов и не годится для всей шкалы от 7 дана до 20 кю. Кроме того, параметры функции вероятностей РС-90 постоянны и одинаковы для всех уровней игроков. Поскольку обычно во всех РС имеется еще и переток рейтинга от стабильных игроков к растущим, то можно было ожидать, что статистика российских партий за 2005–2007гг. позволит выявить какие-либо деформации в шкале рейтингов. Ниже перечислим еще раз основные факторы, влияющие на возникновение деформаций, и рассмотрим механизмы действия этих факторов на шкалу рейтингов.

Фактор 1. Отсутствие форовых рейтинг-партий.
Фактор 2. Неправильная формула вероятностей.
Фактор 3. Переток рейтинга от стабильных игроков к растущим.

Как уже отмечалось, без учета в рейтинге форовых партий реальная шкала рейтингов не может быть адекватной условию постоянства во всех частях шкалы шага в 100 пунктов рейтинга на один ранг традиционной лестницы кю-данов. Действительно, все формулы вероятностей с точностью до величин третьего порядка от разницы рейтингов инвариантны для равных партий относительно растяжений-сжатий шкалы с центром в рейтинге ИИ (точка отсчета шкалы, у нас 3000) и такие деформации не могут быть обнаружены «изнутри системы». Если играются только равные партии, то рейтинги стремятся постепенно занять положение, при котором частоты совпадают с вероятностями, какой бы неправильной не была сама формула, и шаг становится отличным от 100. Таким образом, если формула задана с ошибкой, то возникает деформация шкалы со следующим механизмом ее формирования.

Рассмотрим формулу вероятностей РС-90 и возьмем середину шкалы. Пусть изначально шкала адекватна лестнице рангов и вообще правильная, а игрок с рейтингом 1000 (11 кю) встречается попеременно с соперниками выше его на один ранг, которым проигрывает, и ниже его на один ранг, у которых выигрывает. Ошибка формулы вероятностей в этом случае составляет около 11% и симметрична: вероятность победы по предположительно правильной формуле РС-2005 составляет 55% во встречах с более слабыми, 45% – с более сильными. Формула РС-90 дает соответственно 66% и 34%. В итоге при коэффициенте динамичности 100 (это значение не принципиально, для простоты берем круглое число) получим, что при выигрыше у более слабого в РС-90 игрок недополучает при пересчете 100 х 0,11 = 11 пунктов рейтинга. Но точно на такую же величину игрок теряет меньше чем положено при проигрыше старшим, т.е. шкала в средней части в обычных условиях стабильной игры не деформируется, хотя колебания рейтинга по амплитуде существенно увеличиваются по сравнению со случаем применения правильной формулы. Для рассмотренного примера: при 20 партиях с более слабыми и таком же числе с более сильными ожидаемое число побед и поражений соответственно 11/9, при совпадении частот с прогнозом при правильной формуле изменение рейтинга в обоих случаях равно нулю, а по формуле РС-90 -202 и +202 соответственно (в сумме тоже 0).

Однако на краях шкалы симметрия нарушается: снизу игрок обычно встречается в основном с более старшими по рейтингу, и хотя чаще им проигрывает, но при этом у него отбирается меньшее число очков, чем положено по правильной формуле, а при более редких выигрышах он получает лишние очки. В итоге баланс рейтинга самого нижнего участника РС даже без роста мастерства оказывается положительным и рейтинг слабейших в РС игроков начинает расти. Затем избыток рейтинга может частично или полностью поглащаться естественным в этой части шкалы ростом мастерства или просто перераспределяется среди чуть более сильных соседей, и тогда этот процесс оттока рейтинга к самым слабым компенсируется снижением рейтинга остальных участников РС, в основном в нижней части шкалы, т.е. эта часть шкалы растягивается книзу с уплотнением шкалы вблизи рейтинга самых слабых.

Вверху шкалы ситуация прямо противоположная, за исключением того, что избыток рейтинга, получаемый лидерами, никуда рассосаться уже не может, т.к. им присуща стабильность в игре и они сохраняют лидирующие позиции длительное время. В итоге лидеры начинают отрываться по рейтингу от остальной группы чуть более слабых стабильных игроков, <i>снижая их средний рейтинг</i>. Это явление было подтверждено экспериментально в РС-90 при анализе рейтинга А.Динерштейна: его российский рейтинг по РС-90 в 2003 году был уже 2878, что превышало его европейский рейтинг 2762, примерно адекватный в среднем в этой части шкалы российскому рейтингу, на 116 пунктов. После экспертной оценки в 2800 пунктов, сделанной в 2005 году для нового проекта РС-2005, он сохранил в последующие 3 года тот же уровень с незначительным снижением рейтинга (в пределах 20-25 пунктов), причем рейтинги в ЕГФ и РФГ(Б) у А.Динерштейна очень близки в течение всего рассматриваемого периода (обе формулы вероятностей в области 6-7 данов дают близкие прогнозы).

Чтобы еще раз наглядно представить скорость отрыва лидера в РС-90, рассмотрим обычного среднего соперника А.Динерштейна в российских турнирах – это как правило игрок 5-6 дана, отстающий от него в среднем на 2 ранга (200 пунктов). Если принять стартовый рейтинг Динерштейна в 2700 пунктов (конец 90-х годов), а его соперника – 2500, то их средний рейтинг равен 2600 (400 пунктов от ИИ) и вероятность победы старшего по РС-2005 будет 100%, а по РС-90 только 80%. Таким образом, выиграв 10 партий у 5-х данов, Динерштейн зарабатывал около 20 пунктов рейтинга просто так, за счет ошибки формулы вероятностей. Поэтому нет проблемы лет за 5 набрать 100 «лишних» пунктов. Заметим еще раз, что такой процесс отрыва лидера приводит к снижению среднего рейтинга основной части игроков дан-уровня без реального снижения уровня игры, и эта волна деформации постепенно смещается вниз шкалы.

Следует еще раз подчеркнуть, что описанные выше процессы дефоромации шкалы играют существенную роль только именно в случае отсутствия учитываемых в РС форовых партий. Так как фора сводит все вероятности побед/поражений примерно к 50% независисмо от конкретного вида функции вероятностей, применяемой в той или иной РС, то ошибки данного вида подавляются при пересчете форовых партий и форовый принцип, таким образом, является мощным стабилизатором всей рейтинговой шкалы.

Последний из рассматриваемых факторов – рост мастерства игроков – так же приводит в целом к деформации шкалы типа растяжения, т.к. растущий игрок отнимает лишние пункты рейтинга в основном у более старших, и продвигаясь по шкале вверх вплоть до своего уровня стабилизации может суммарно отнять у стабильных игроков тысячи пунктов рейтинга. В самом деле, пусть игрок вошел в РС с рейтингом 1000 (11 кю), а стабилизировался на уровне 2000 (1 кю). Тогда этот прирост в 1000 пунктов, если не было экспертных оценок и аномалок, полностью получен за счет отбора примерно такого же количества пунктов у остальных игроков (сначала только у соперников, с которыми встречался растущий, а потом этот дефицит рейтинга перераспределяется между всеми остальными участниками). Если в РС кроме растущего еще 10 стабильных игроков, то они понизятся в рейтинге каждый на целый ранг! При 100 игроках среднее снижение уже не так заметно – всего 10 пунктов. Однако при достаточном количестве в РС растущих игроков стабильные игроки постоянно теряют рейтинг. По оценкам для РС-90 эта скорость потери рейтинга стабильной группой данов составляла до 20 пунктов в год и за 15 лет эксплуатации РС общие потери рейтинга достигали порядка 300 000 пунктов.

Описанные выше механизмы деформации полностью подтверждаются статистикой: проведенная в начале 2008 года коррекция шкалы, основанная на статистическом анализе всех сыгранных в РС партий, хорошо исправляет ситуацию по статистике для 164 турниров 2005–2007гг. В 37 турнирах 2008 года эффективность коррекции также подтвердилась: имеется хорошее совпадение частот с прогнозами (сдвиги для скорректированых рейтингов находятся в пределах статистической погрешности, в то время как статистика без коррекции шкалы на том же наборе партий дает расхождения в несколько раз большие). Более того, анализ статистики показал, что уже к концу 2005 года расхождения частот и прогнозов стали уменьшаться за счет резкого увеличения числа форовых игр (18% в 2005 году, в среднем 13% в последние три года), а также за счет применения более правильной функции вероятностей и использования более динамичного алгоритма, основанного на усовершенствованном методе аномальной коррекции и применении формул Гликмана с индивидуальными отклонениями рейтинга. Но скорость такой сходимости крайне низка, в последующие два года скорость автокоррекции упала и для исправления шкалы внутри самой РС без коррекции административным способом пришлось бы ждать лет 10-15, т.е. примерно столько же, сколько деформации накапливались.


Здесь следует сказать сразу же и о выборе функции вероятностей, т.к. обработка статистики партий часто осуществляется с учетом прогнозируемых исходов. Исторически в первой РС Эло, внедренной в ФИДЕ в начале 70-х годов, была принята формула с дробно-экспоненциальной зависимостью вероятностей исходов от разницы рейтингов. Это семейство функций, асимптотически выходящих на 0 и 1 соответственно при бесконечно большой отрицательной и положительной разнице рейтингов, имеет два свободных параметра. Графики таких функций симметричны относительно средней точки, где вероятность равна 0.5, и общее наименование класса – логистические кривые. Формула вероятностей на основе логистической кривой для парных сопоставлений впервые была предложена в 1953 году (модель Брэдли-Терри). Она выводится теоретически из предположения о транзитивности отношения частот побед (подробнее – см. сайт ЕГФ например), а статистического обоснования для игр, похоже, не существует.

Само по себе предположение о транзитивности отношений частот является далеко не очевидным и поэтому не подходящим для постулирования при построении РС. Любое другое предположение, например о нормальном поведении распределения вероятностей, ничем не хуже. Более того, интеграл Гаусса является интегро-экспоненциальной функцией с аналогичными свойствами, что и у логистической кривой, и они могут использоваться для взаимной аппроксимации (возможно, что логистические кривые появились вообще из экспериментов над случайными нормально распределенными величинами как упрощение интеграла Гаусса).

Теоретико-вероятностный анализ показывает, что для асимптотических свойств сходимости РС к адекватной ранжировке вид функции вероятностей не так важен. Однако в практических целях достоверного прогнозирования исходов роль правильного выбора функции вероятностей невозможно переоценить. Как же выбрать функцию вероятностей, если ничего практически неизвестно об индивидуальных распределениях силы игры участников РС? И тут снова игра го оказывается в исключительном положении, опять благодаря все тому же форовому принципу.

Если начальное распределение рейтингов произвольно и задана какая-то формула вероятностей и нет других механизмов извлечения информации, кроме парных сопоставлений (без форы или иных коррекций разницы в рейтингах), а все игроки уже стабилизировались и не меняют своего уровня, то вероятно распределение рейтингов будет сходиться к некоторому равновесному состоянию, где все наблюдаемые частоты побед будут в среднем совпадать с ожидаемыми исходами, рассчитанными по заданной формуле вероятностей. Скорость такой сходимости крайне низка, но гораздо важнее то, что в го есть совершенно другой механизм стабилизации, на порядок более эффектиный: это форовые игры.

Действительно, в го начальные распределения рангов (и порождаемых ими рейтингов) фактически всегда довольно точно соответствуют правильным форовым соотношениям. То же самое как правило справедливо и для новых игроков, т.к. их экспертные оценки обычно основываются на играх с форой. Правильность форовых соотношений в шкале рангов (рейтингов) является очень устойчивым признаком, если играется достаточное количество форовых партий. Устойчивость определяется тем, что фора обычно выбирается близкой к реальному соотношению рангов и вероятности исходов приближаются к 0.5 независимо от вида заложенной в РС формулы вероятностей. Т.е форовый принцип подавляет ошибки формулы вероятностей, и из статистики равных партий в сообществе игроков с правильными форовыми соотношениями можно получить информацию об истинном виде распределения вероятностей. Это фундаментальный вывод, подтверждающийся экспериментально: в ЕГФ хорошо выполняются форовые соотношения, что регулярно проверяется и подтверждается при мониторинге РС, однако формула вероятностей, основанная на логистической кривой, дает большие расхождения с наблюдаемыми частотами в равных партииях и это расхождение никак не уменьшилось за последние 5 лет, хотя объем статистики из более чем 108000 партий за тот же период вырос примерно в полтора раза.

С другой стороны, в России прекратили учитывать в рейтинге форовые партии примерно лет 20 назад и за период вплоть до введения нового проекта РС-2005 форовые соотношения не могли не подвергнуться существенным искажениям, т.к. формула вероятностей, применявшаяся в тот же период, не была достаточно правильной (область корректного ее применения была очень узкой по диапазону рангов), мониторинг РС не осуществлялся и не контролировались никак возможные деформации шкалы рейтингов. Наличие деформаций было выявлено позже в 2008 году, после того как принятый новый проект РС-2005 отработал 3 года и был накоплен свежий статистический материал.

Поскольку статистика ЕГФ, как показано выше, пригодна для выявления истинных вероятностных соотношений, то такая работа по статистическому анализу была проделана в 2003 году и было выяснено, что наиболее подходящим для выбора функции вероятностей из достаточно простых классов кривых является дробно-гиперболическое семейство. В общем виде формула вероятностей по проекту РС-2005 содержит постоянный член 0.5 и добавок в виде дроби, в числителе которой стоит разница рангов (рейтингов), а в знаменателе – некоторое среднее расстояние партнеров по шкале рейтинга от точки отсчета – рейтинга ИИ. Сравнение средних частот по всем рангам при средней разнице между партнерами в 1, 2 или 3 ранга дало очень хорошее согласие при простых коэффициентах базовой формулы, и только при разнице в 4 ранга было более существенное расхождение, превышающее допустимую статистическую погрешность. Последующие повторные сопоставления частот и ожидаемых результатов на расширенной статистике ЕГФ показали такое же хорошее согласие – за прошедшие 5 лет не изменилось практически ничего.

В заключение следует сказать, что такой вид формулы вероятностей можно вывести и теоретически из аппроксимации нормального распределения вероятностей. А нормальный вид функции вероятностей вполне естественен, учитывая большое число совершаемых в партии ходов. В этом случае вполне вероятно выполнение условий применимости центральных предельных теорем теории вероятностей, и тогда сумма случайных величин, каковыми являются ошибки соперников, совершаемые ими в ходе партии, должна быть асимптотически нормальной.


Размер правильного коми, т.е. обеспечивающего выравнивание шансов сторон при игре без форы, является внутренним свойством самой игры и в равной партии двух ИИ очковый результат игры должен быть в пользу черных ровно на величину коми (с точностью до условных пол-очка). К сожалению, определить теоретически точное значение правильного коми или экспериментально проверить адекватность используемого значения с абсолютной достоверностью практически невозможно. Остается только проводить мониторинг на основе статистики партий сильнейших профессионалов и наблюдать за согласием частот побед с ожидаемыми 50%. Однако на такую статистику влияет ряд факторов субъективного характера и прогресс в теории игры, и вполне возможно, что размер принятого на практике коми еще будет уточняться.

Между разницей в рангах (или рейтингах) двух игроков и ожидаемым средним очковым результатом партии между ними при не очень большой разнице в рангах имеется практически 100% корреляция. Поэтому правильное коми также должно соответствовать определенной разнице рейтингов. Если предполагать линейность и однородность шкалы рейтингов, то правильное коми должно быть эквивалентно половине шага шкалы (50 пунктов рейтинга при шаге шкалы в 100 пунктов на ранг). Т.е. два игрока с разницей уровней в пол-ранга (50 пунктов рейтинга) в партиях без коми, когда черными играет более слабый соперник (фора 1), должны иметь равные шансы и частота побед любой из сторон при росте числа партий обязана приближаться к 50%. Сформулированное выше утверждение о соответствии правильного коми половине шага шкалы рейтингов доказывается следующим образом.

По предположению о линейности, нарастание очкового преимущества при добавлении камней форы происходит всегда на одно и то же число. Адекватная новой форе разница рангов увеличивается на соответствующее целое число, а разница рейтингов – на кратное добавленной разнице рангов (или добавленных камней форы) с коэффициентом 100 (зафиксируем такой шаг шкалы). Из симметрии ситуации при смене цвета соперников в игре без форы и без коми ясно, что размер коми должен соответствовать половине разницы ожидаемых очковых результатов партии при игре черными и белыми соответственно, т.к. переход от игры черными к игре белыми соответствует изменению ожидаемого результата партии на два коми. С другой стороны, добавление камня форы можно рассматривать как пас белых, и аналогично смена цвета эквивалентна пасу черных. Следовательно, смена цвета (два коми) эквивалентна разнице в один ранг, и коми в пунктах рейтинга эквивалентно половине шага шкалы.

Таким образом, при построении РС, согласованной с принципом гандикапа, необходимо учитывать, что фора в камнях эквивалентна разнице рейтингов пропорционально числу камней форы со сдвигом на полкамня (полранга), т.е. сдвиг эквивалентен одному коми, или 50 пунктов рейтинга при шаге шкалы 100 пунктов на ранг. Для обычно используемой форы от 1 до 9 камней получаем следующее соответствие между форой и адекватной ей разницей рейтингов: фора 1 (право первого хода без коми) = 50 пунктов, фора 2 (пас белых после первого хода черных) = 150, ..., фора 9 (8 пасов белых) = 850. Соответственно ожидаемый результат партии без форы между игроками разных рангов пропорционален удвоенному коми и составляет 13-15 очков на один ранг разницы в уровнях игры, если исходить из принятых на практике величин коми. Этот вывод хорошо согласуется с данными, известными из разных источников, по которым оценка очкового преимущества черных при форе в 9 камней составляет порядка 130–140 очков. Если вспомнить о том, что коми 5.5 было предположительно определено с ошибкой в 2-3 очка в пользу черных, то для форы 9, эквивалентной 850 пунктам разницы в рейтинге или 17 коми, получим оценку ~ 127 очков при коми 7.5, 136 очков при коми 8.

В заключение раздела кратко опишем, как фора в камнях учитывается при вычислении прогнозируемых результатов в РС. Обычно формула вероятностей (см. следующий раздел) задается в виде функции от разницы рейтингов соперников и может зависеть еще от ряда параметров, характеризующих, например, уровень стабильности игроков или иных характеристик. Фора сокращает разницу в прогнозируемом результате партии в очках, поэтому ее эквивалент в пунктах рейтинга просто вычитается из разности рейтингов. Таким образом, если встречаются два игрока с разницей в рейтингах, кратной рейтинговой величине коми (50 пунктов при шаге шкалы 100), то можно установить точную фору в камнях, которая выравнивает шансы сторон. Например, при разнице в 50 пунктов правильная фора должна быть 1 камень, при 150 – два камня и т.д. Если фора задана в камнях без дополнительной компенсации несоответствия разницы рейтингов и рейтингового эквивалента форы (такая дополнительная компенсация тоже называется коми, которое может быть вообще говоря произвольным – в зависимости от условий проведения турнира), то ожидаемый результат будет отличаться от 0.5, и точное значение вероятностей победы или поражения определяется с помощью формулы вероятностей и с учетом рейтингового эквивалента форы как описано выше.


Для корректной обработки статистики турниров по го необходмо прежде всего выделить группы учета партий по уровням мастерства соперников. Здесь возможны два подхода:
– группировать партии по средним рангам соперников;
– группировать партии по равномерной вероятности побед/поражений в равных партиях для средних представителей из соседних групп.
При первом подходе традиционно принято для минимальных групп учета принимать партии игроков примерно одного ранга, затем к ним добавляются группы партий по увеличивающейся на один ранг разнице в силе игры. В этом случае базовыми группами учета будут партии на равных между игроками одного ранга, потом партии игроков, отличающихся на один, два, три, четыре ранга и т.д. Это самое мелкое деление шкалы рейтинга, которое используется на практике для статистического учета партий в го. Недостатком такого подхода является неравномерность вероятностей по шкале рангов для различных групп по уровням игры при фиксированной разнице в рангах соперников. Это обусловлено тем, что вероятности побед зависят не только от разницы в силе игры, но и от уровня соперников.

Первый подход является традиционным и используется в статистике Еврропейской Го Федерации (ЕГФ) и ниже приводятся примеры такой статистики.

Второй подход, принятый нами в качестве основного, более удобен, так как в этом случае вероятности в различных группах учета при фиксированной разнице рангов в среднем оказываются примерно одинаковыми по всей шкале. В го имеется естественная разбивка игроков по разрядам Единой Всероссийской Спортивной Классификации (ЕВСК). За основу разрядной сетки взята вероятность победы в 80% при встрече среднего игрока какого-либо разряда со средним соперником из разряда на одну ступень ниже, при этом вся шкала разбивается на следующие разряды по рейтингу:
б/р – до 900,
3р – 900–1399,
2р – 1400–1799,
1р – 1800–2149,
КМС – 2150–2349,
МС – 2350–2549,
Гр – 2550 и выше.

Разбивка на группы на основе разрядной сетки лучше подходит для целей статистического учета партий в российских турнирах еще и потому, что в этом случае обеспечивается достаточное наполнение групп, т.к. в целом выборка партий не настолько объемна, чтобы можно было вводить более мелкие группы учета по рангам. Аналогичный подход к выделению групп учета принимается и для партий на форе, только число групп увеличивается за счет разбиения базовых групп на подгруппы по форе от 1 до 9. В некоторых случаях вводятся также укрупненные группы учета (нижняя и верхняя части шкалы рейтинга с границей по рейтингу 1500).

Основное внимание при анализе статистики следует обращать на разницу частот и вероятностных прогнозов, т.к. эта характеристика является главным критерием качества статистической модели, заложенной в основу рейтинг-системы (РС). Кроме того, различные группы учета имеют неодинаковую значимость для оценок качества РС: наиболее важными являются группы из верхней части шкалы, т.к. игроки из этой группы являются наиболее стабильными участниками РС и выступают в роли анкеров по отношению к остальным участникам. В форовых партия наиболее важными являются группы с форой до 4 камней, т.к. здесь можно рассчитывать на хорошее соблюдение условия линейности форы, а при большей форе могут проявляться особенности, не достаточно изученные на данное время.

Отдельно следует отметить особенности учета партий игроков с экспертными оценками (ЭО) уровня игры. Часть игроков получает ЭО при первом входе в РС, но есть игроки, которые имели перерыв в выступлениях, за время которого существенно повысили свой уровень и поэтому также получали ЭО, которые принимались за их новый стартовый уровень при пересчетах рейтинга. К этой группе примыкают игроки, которые не входят в РС (т.н. «внешние», в основном иностранные участники российских турниров) и их партии учитываются только в целях пересчета рейтинга игроков из РС. По указанным группам участников ведется дополнительная статистика, а игроки с подтвержденными ЭО, т.е. показавшие по результатам пересчитываемого турнира неотрицательное измененение рейтинга, учитываются в статистике наравне с обычными участниками РС. Необходимость отдельного учета неподтвержденных ЭО объясняется тем, что анализ статистики показывет значительное в среднем завышение ЭО по сравнению с реально достигнутым уровнем игры. Таким образом, вся статистика имеет следующую структуру: в основные группы учета входят партии между участниками из РС, включая игроков с подтвержденными ЭО, и отдельно ведется учет партий между игроками с ЭО и соперниками из РС (включая игроков с подтвержденными ЭО), а также дополнительно ведется учет всех партий игроков с неподтвержденными ЭО и внешних (правая сторона в таблицах по группам учета).

Все рейтинги и, соответственно, группы учета в статистических таблицах указываются с учетом проведенной в начале 2008 года коррекции шкалы. Параметры, относящиеся к старой шкале (вероятностные прогнозы, средние рейтинги соперников и их разница) указываются в отдельных колонках (ожидаемые результаты – с индексом 1).

Вероятностная функция в той или иной РС является частью статистической модели и выбирается на основе специальных теоретических исследований или статистического анализа на больших выборках партий. Традиционно, начиная с шахматной РС А.Эло (1970), для формулы вероятностей в логических играх как правило выбирают кривую из семейства гауссовых распределений (интеграл Гаусса, т.е. нормальное распределение с экспоненциальной плотностью), или кривую с дробно-экспоненциальной зависимостью вероятностей победы от разницы рейтингов (класс так называемых «логистических кривых»). В РС ЕГФ выбрана логистическая кривая с двумя свободными параметрами, уточняемыми на основе статистического анализа. Класс нормальных распределений также является двупараметрическим, и оба класса могут использоваться для взаимной аппроксимации при подходящем выборе параметров в заданном интервале значений рейтингов. Статистика равных партий в какой-либо узкой группе по рейтингу в данной РС задает одно условие на параметры, а второе условие обеспечивается статистикой форовых партий, так что для двупараметрических семейств распределений этой информации вполне достаточно для полного определения статистической модели РС с зависимостью вероятностных формул как от разницы рейтигов, так и от уровней игроков при фиксированном классе распределений.

Поскольку анализ статистики ЕГФ (более 100 000 партий на момент разработки проекта РС-2005) и регулярно проводимый в ЕГФ мониторинг показали, что форовые соотношения в РС ЕГФ соблюдаются достаточно точно (в пределах статистической погрешности), то статистика ЕГФ пригодна для уточнения параметров вероятностных распределений как для форовых, так и для равных партий, если выбран какой-либо подходящий двупараметрический класс кривых (не обязательно только нормальных или логистических).

Соблюдение в РС правильных форовых соотношений означает, что вероятности побед/поражений при правильной форе близки к 50% независимо ни от разницы рангов, ни от расположения соперников на шкале рейтингов (рангов). В этом случае статистика партий на форе практически не зависит от не очень больших линейных сдвигов шкалы (при фиксированной точке отсчета, соответствующей рейтингу идеального игрока, сокр. ИИ), а статистика равных партий характеризует истинные вероятностные соотношения в совокупности игроков независимо от выбора формулы вероятностей в РС, т.к. форовые соотношения от вида функции вероятностей не зависят. С другой стороны, обычно применяемые формулы вероятностей инвариантны с высокой точностью относительно растяжений-сжатий всей шкалы с центром в рейтинге ИИ, принимаемом за относительную точку отсчета рейтингов. В наиболее часто используемых абсолютных шкалах рейтингов обычно эта точка не ниже 3000 пунктов.

Исходя из выше изложеного, в 2003 году было проведено статистическое исследование выборки партий ЕГФ на предмет определения подходящего для формулы вероятностей двупараметрического класса функций и уточнения конкретных значений параметров. Оказалось, что частоты в равных партиях для фиксированной разницы в уровне соперников 1, 2, 3 и 4 ранга качественно ведут себя одинаково: кривые частот имеют гиперболический вид, а при обращении частот (замена зависимой переменной – частоты Y – на обратную величину Z = 1/Y) эти кривые переходят в прямые, сходящиеся примерно в одной точке на оси рейтингов, которая имеет физический смысл рейтинга ИИ. Вычисленное на данной выборке с использованием метода наименьших квадратов значение рейтинга ИИ с высокой точность оказалось равно 3000 пунктов. Сами так полученные статистические прямые имели углы наклона с высокой точность соответствующие линейному приращению частот при переходе с одной прямой на другую. Поэтому для проекта РС-2005 был выбран класс непрерывных монотонных и симметричных по разнице рейтингов кривых, состоящих из трех кусков: константы 0 и 1 на достаточном удалении по разнице рейтингов от точки симметрии, где эта разница равна 0 и вероятность P = 0.5, а в средней части между этими предельными значениями используется линейно-гиперболическая формула зависимости вероятности от разницы рейтингов (в числителе дроби, прибавляемой к 0.5) и среднего уровня пары (расстояние пары от рейтинга ИИ в знаменателе дроби).

Описанный выше класс кусочно-гладких кривых при не очень больших разницах рейтингов является хорошей аппроксимацией как для класса нормальных распределений, так и для класса логистических кривых при согласованном выборе параметров. Ниже в качестве иллюстрации приводится сопоставление частот с вероятностями по формуле ЕГФ и принятой в РС-2005 формуле – на статистике партий ЕГФ, в которых на равных встречались соперники со средней разницей уровней в один ранг.

Таблица 1.
Сравнение частот побед в равных партиях с вероятностными прогнозами по формулам ЕГФ и РФГ при средней разнице в 1 ранг
Приведены частоты побед более слабого в усредненных по рангам парах соперников

P_егф – вероятность по формуле ЕГФ
P_рфг – вероятность по формуле РФГ
Ранг  R1        R2     DR      Dcp  Побед Партий   Статвес Частота  P_егф Сдвиг  С весом   P_рфг  Сдвиг   С весом
14K  694,3     791,3   97     2258    569   1249   0,01603   45,6   38,2   7,3     0,12    45,7   -0,1   -0,0016
13K  787,9     881,2   93,3   2166    617   1397   0,01793   44,2   38,1   6       0,11    45,7   -1,5   -0,0269
12K  883,8     966,5   82,7   2075    673   1471   0,01888   45,8   39,3   6,5     0,12    46,0   -0,2   -0,0038
11K  974,4    1066,2   91,8   1980    881   1883   0,02417   46,8   37,8   9       0,22    45,4    1,4    0,0338
10K  1072,4   1155,4   83     1887   1145   2561   0,03287   44,7   38,6   6,1     0,20    45,6   -0,9   -0,0296
9K   1164,3   1257,8   93,5   1790   1171   2594   0,03330   45,1   37     8,1     0,27    44,8    0,3    0,0010
8K   1265,4   1347,5   82,1   1694   1222   2779   0,03567   44     38,2   5,8     0,21    45,2   -1,2   -0,0428
7K   1356,1   1442,9   86,8   1601   1429   3203   0,04111   44,6   37,2   7,4     0,30    44,6    0      0
6K   1455,3   1548     92,7   1499   1691   3949   0,05069   42,8   36     6,8     0,34    43,8   -1     -0,0507
5K   1554,8   1641,7   86,9   1402   1945   4361   0,05600   44,6   36,2   8,4     0,47    43,8    0,8    0,0448
4K   1654     1742,8   88,8   1302   2232   4921   0,06317   45,4   35,5   9,9     0,63    43,2    2,2    0,1390
3K   1753     1842,5   89,5   1203   2390   5546   0,07119   43,1   34,8   8,3     0,59    42,6    0,5    0,0356
2K   1853,8   1951,2   97,4   1099   2527   6218   0,07982   40,6   32,7   8       0,64    41,1   -0,5   -0,0400
1K   1964,4   2065,7   101,3   986   3059   7738   0,09933   39,5   31,2   8,4     0,83    39,7   -0,2   -0,0199
1D   2077,1   2172,4   95,3    877   2728   7269   0,09331   37,5   31,1   6,4     0,60    39,1   -1,6   -0,1493
2D   2182,5   2279     96,5    771   2156   6236   0,08005   34,6   29,8   4,7     0,38    37,5   -2,9   -0,2321
3D   2288,6   2380,5   91,9    667   2025   5840   0,07496   34,7   29,8   4,9     0,37    36,2   -1,5   -0,1124
4D   2384,2   2476,9   92,7    571   1457   4746   0,06092   30,7   28,7   2       0,12    33,8   -3,1   -0,1889
5D   2495,2   2590,8   95,6    459    905   3256   0,04180   27,8   26,7   1,1     0,05    29,2   -1,4   -0,0585
6D   2598,7   2728,6  129,9    343    102    687   0,00882   14,8   18,5  -3,6    -0,03    12,1    2,7    0,0238
                                    30924  77904   Средний сдвиг                   6,53% (ЕГФ)           -0,67% (РФГ)

В таблице опущены ранги от 15 кю и ниже ввиду больших отклонений в этой части шкалы из-за влияния нижней границы рейтинга, где ранг 20 кю присваивается в ЕГФ всем новичкам независимо от реального уровня игры. Как видим, линейно-гиперболическая формула на порядок точнее принятой в ЕГФ логистической кривой. Подробные данные по использованной здесь статистике партий ЕГФ предоставлены в октябре 2006 года Европейским рейтинг-комитетом.


Всего c 08.01.2005 по 23.12.2007 проведено в России 164 турнира, в которых сыграно 8354 партии. В статистике приводятся частоты побед более старшего (более сильного по рейтингу) в парах игроков. В форовых играх автоматически более старшим считается дающий фору. Как видно из колонок частот и прогнозов для форовых партий, разница между итоговыми числами по всем турнирам (0.25%) значительно ниже уровня допустимой статистической погрешности (стандартное отклонение биномиального распределения составляет для этой выборки 1.7%). Для сравнения: прогноз для шкалы без коррекции дал 564 ожидаемые победы, т.е. отклонение от прогноза составило недобор в 43 победы из 888 партий или около 5%, что превышает стандартное отклонение примерно в три раза. Достаточно значительное отклонение (примерно 1%) в равных партиях комментируется далее при рассмотрении неравномерности отклонений по шкале, хотя этот уровень отклонения не превышает допустимую статистическую погрешность.

Таблица 2.
Сводная статистика по всем турнирам до 2008 года

Последние колонки относятся к статистике партий игроков с ЭО и внешних:
ЭО – число участников с экспертными оценками
ЭО+ – число подтвержденных ЭО
Вн – число внешних участников
И_Э – игр с участием ЭО
И_В – игр с участием внешних

N_tur                   	Всего:	Фор-ых	Уч_рав	N_wins	_P_win	Уч_фор	N_wins	_P_win	Уч-ков	 ЭО	ЭО+	 Вн	И_Э	И_В
  1 050108_StP_For_Chr  	26	24	2	1	1,06	24	11	12,02	12	0	0	0	0	0
  2 050109_R12_Izh      	112	0	82	62	50,08	0	0	0	38	9	3	0	30	0
  3 050213_Nov_For_Ch2  	25	24	1	0	0,65	17	9	9,39	10	4	2	0	7	0
  4 050227_Izh_Sam      	19	0	9	5	5,46	0	0	0	8	6	3	0	10	0
  5 050227_Tat_Kaz_Cu1  	102	0	75	57	58,76	0	0	0	34	9	4	0	27	0
  6 050313_Izh_Ch2      	47	0	28	20	15,74	0	0	0	21	12	6	0	19	0
  7 050313_Mos_ChF      	30	0	30	20	21,57	0	0	0	10	0	0	0	0	0
  8 050320_Izh_Ch1      	43	0	43	35	32,71	0	0	0	18	0	0	0	0	0
  9 050320_StP_JAC      	138	0	111	74	79,76	0	0	0	48	13	8	0	27	0
 10 050327_Izh_ChF      	5	0	5	3	3,25	0	0	0	4	0	0	0	0	0
 11 050327_Mos_C18      	68	0	50	42	35,99	0	0	0	28	8	3	0	18	0
 12 050403_Kaz_S12      	143	0	143	109	83,69	0	0	0	48	1	1	0	0	0
 13 050403_Kaz_S18      	78	0	78	61	60,5	0	0	0	27	0	0	0	0	0
 14 050417_Izh_Ust_C12  	36	0	36	23	20,13	0	0	0	16	0	0	0	0	0
 15 050417_Tat_Kaz_C12  	15	0	15	13	12,2	0	0	0	6	0	0	0	0	0
 16 050421_Tat_Kaz_C18  	28	0	28	23	24,45	0	0	0	8	0	0	0	0	0
 17 050424_Izh_Stu      	25	0	25	20	16,45	0	0	0	10	0	0	0	0	0
 18 050424_NNo_OKR      	95	0	95	64	68,82	0	0	0	39	0	0	0	0	0
 19 050424_StP_Cu2      	25	0	25	19	17,89	0	0	0	11	0	0	0	0	0
 20 050502_Kem_CKu      	41	31	1	0	0,59	19	12	11,62	17	13	6	0	21	0
 21 050502_StP_ChF      	28	0	28	17	19,81	0	0	0	8	0	0	0	0	0
 22 050504_StP_Cu1      	30	0	30	26	25,84	0	0	0	13	0	0	0	0	0
 23 050509_Chl_Cup      	138	0	111	85	79,46	0	0	0	47	11	5	0	27	0
 24 050510_Nov_ChF      	12	0	12	9	8,34	0	0	0	4	0	0	0	0	0
 25 050525_Mos_For      	29	27	2	0	1,24	27	9	16	20	0	0	0	0	0
 26 050529_Kaz_MAV      	105	11	89	54	59,58	11	6	5,7	42	3	2	0	5	0
 27 050529_StP_For_Vic  	30	11	19	16	15,51	11	9	6,81	11	0	0	0	0	0
 28 050612_Bar_CAl      	35	33	2	0	1	33	20	22,71	11	0	0	0	0	0
 29 050626_Nov_Sib_Hok  	40	29	11	8	7,92	29	19	17,62	12	0	0	0	0	0
 30 050626_Vla_Fmatch   	36	36	0	0	0	0	0	0	12	1	0	6	36	36
 31 050630_Mos_Kon      	166	0	141	85	91,75	0	0	0	68	4	1	3	25	15
 32 050706_Rus_StP_For  	211	157	47	22	24,5	140	65	70	81	9	7	3	24	17
 33 050710_R16_StP      	117	0	111	84	75,89	0	0	0	40	0	0	1	6	6
 34 050825_Kha          	95	87	1	1	0,68	59	40	32,97	32	16	9	0	35	0
 35 050904_Pet_CuK      	35	0	35	31	31,4	0	0	0	14	0	0	0	0	0
 36 050918_Eka_ChO      	25	0	25	23	20,59	0	0	0	10	0	0	0	0	0
 37 050925_Mos_Youth    	54	0	21	16	13,4	0	0	0	18	9	2	0	33	0
 38 050925_Rus_Mos_CAC  	142	0	119	83	77,32	0	0	0	58	1	0	4	23	20
 39 051009_Izh_ChF_Opn  	25	0	20	19	15,42	0	0	0	10	2	1	0	5	0
 40 051009_Rus_Izh_Std  	96	0	96	75	69,21	0	0	0	32	0	0	0	0	0
 41 051016_Vla          	52	49	0	0	0	33	21	18,22	22	3	0	2	19	9
 42 051020_StP_Ch1_SF1  	28	0	19	16	14,45	0	0	0	12	3	1	0	9	0
 43 051023_Mos_JAC_Yth  	25	0	16	11	10,71	0	0	0	10	3	0	0	9	0
 44 051023_Rus_Mos_JAC  	111	0	111	79	76,43	0	0	0	47	4	4	0	0	0
 45 051030_StP_Ch1_SF2  	33	0	30	26	24,46	0	0	0	14	2	1	0	3	0
 46 051106_Nov_For_Opn  	42	37	3	2	1,9	18	8	10,24	29	9	5	8	21	14
 47 051106_R18_Kaz      	112	0	112	90	78,69	0	0	0	33	0	0	0	0	0
 48 051127_Per_ChO      	109	0	104	61	64,34	0	0	0	45	2	1	0	5	0
 49 051212_Tat_Kaz_SF2  	15	0	15	14	11,78	0	0	0	6	0	0	0	0	0
 50 051212_Tat_Kaz_SF1  	15	0	15	11	11,13	0	0	0	6	0	0	0	0	0
 51 051212_Tat_Kaz_Ch1  	15	1	1	1	0,66	0	0	0	6	6	2	0	14	0
 52 051212_Tat_Kaz_ChF  	15	0	15	11	10,86	0	0	0	6	0	0	0	0	0
 53 051218_Kem_ChF      	11	0	11	10	8,15	0	0	0	6	0	0	0	0	0
 54 051224_RCF_StP      	5	0	5	2	3,67	0	0	0	4	0	0	0	0	0
 55 051224_RCM_StP      	44	0	44	37	34,31	0	0	0	10	0	0	0	0	0
 56 051225_Izh_For      	25	23	2	0	1,34	23	14	13,06	10	1	1	0	0	0
 57 051225_Izh_For_Yth  	15	14	1	0	0,52	14	10	7,3	6	0	0	0	0	0
 58 051231_NNo_ChF      	35	0	25	16	18,39	0	0	0	14	3	1	0	10	0
 59 060108_Chl_Opn      	58	0	53	45	39,72	0	0	0	20	3	2	0	5	0
 60 060108_R12_Chl      	78	0	68	51	46,57	0	0	0	27	7	5	0	10	0
 61 060122_Mos_SF1      	10	0	10	10	8,97	0	0	0	5	0	0	0	0	0
 62 060129_StP_LiBo     	78	0	75	51	58,72	0	0	0	28	3	2	0	3	0
 63 060205_Mos_Kido     	53	40	12	7	8,02	31	10	17,34	21	2	0	0	10	0
 64 060222_Mos_Qua      	9	5	4	1	2,17	5	3	2,82	12	0	0	0	0	0
 65 060223_RDo_TCh      	16	0	6	2	5,06	0	0	0	16	7	1	0	10	0
 66 060225_Chl          	54	0	50	34	33,44	0	0	0	22	1	0	0	4	0
 67 060225_Tat_Cup      	70	14	55	44	40,76	12	9	7,43	29	1	0	0	3	0
 68 060326_RDo_Ch       	75	0	46	32	30,97	0	0	0	31	16	8	0	29	0
 69 060326_StP_JCC      	42	0	23	20	18,67	0	0	0	18	0	0	4	19	19
 70 060331_StP_Ch       	28	0	28	21	21,67	0	0	0	8	0	0	0	0	0
 71 060409_Kaz_T12      	15	12	2	1	1,45	4	2	2,61	6	2	0	0	9	0
 72 060413_Kaz_T18      	25	1	24	19	19,63	1	1	1	8	0	0	0	0	0
 73 060423_NNo_OC       	90	0	90	73	68,93	0	0	0	30	0	0	0	0	0
 74 060423_StP_C2L      	27	19	5	5	2,99	14	6	8,42	14	6	4	0	8	0
 75 060430_Izh_ChP      	54	0	54	38	40,43	0	0	0	23	0	0	0	0	0
 76 060430_Mos_Qua      	14	10	4	3	2,52	10	8	4,89	12	0	0	0	0	0
 77 060430_StP_C1L      	24	0	24	22	19,7	0	0	0	11	0	0	0	0	0
 78 060509_Chl_OKR      	102	0	82	66	57,91	0	0	0	38	10	6	0	20	0
 79 060510_Izh_Fin      	5	0	5	4	3,98	0	0	0	4	0	0	0	0	0
 80 060528_Kaz_KMV      	143	9	121	76	81,4	5	2	3,22	49	1	1	3	17	17
 81 060530_Kaz_S12      	89	0	74	42	46,09	0	0	0	39	1	0	2	15	10
 82 060530_Kaz_S18      	30	0	30	28	24,25	0	0	0	13	0	0	0	0	0
 83 060707_R25_StP      	48	0	48	35	36,88	0	0	0	20	0	0	0	0	0
 84 060711_R16_StP      	36	0	36	30	28,66	0	0	0	13	0	0	0	0	0
 85 060711_ROC_StP      	89	0	89	64	68,26	0	0	0	26	0	0	0	0	0
 86 060716_RTC_StP      	81	0	81	62	65,1	0	0	0	29	0	0	0	0	0
 87 060723_Bar_CA2      	14	9	5	5	4,01	9	7	5,28	6	0	0	0	0	0
 88 060820_Kha_ChA      	15	11	4	1	2,34	11	6	7,12	6	0	0	0	0	0
 89 060820_Kha_ChB      	15	13	2	1	1,01	8	4	4,71	6	2	1	0	5	0
 90 060820_Kir          	10	10	0	0	0	10	7	6,52	5	1	1	0	0	0
 91 060830_Mos_ChS      	27	0	23	19	16,36	0	0	0	16	1	0	0	4	0
 92 060831_Mos_QT       	9	7	2	2	1,29	7	5	3,99	8	0	0	0	0	0
 93 060903_Pet_KrC      	24	0	24	21	20,61	0	0	0	10	0	0	0	0	0
 94 060924_StP_F4-1     	27	24	3	1	1,77	18	14	13,41	12	3	1	0	6	0
 95 061001_StP_F4-2     	34	32	0	0	0	18	14	12,56	14	7	4	1	16	5
 96 061015_Mos_JAC_Det  	52	0	32	18	18,7	0	0	0	18	10	6	0	20	0
 97 061015_Rus_Mos_JAC  	164	0	136	79	86,12	0	0	0	69	13	6	1	28	3
 98 061022_Izh_OCR_Yth  	38	0	18	6	9,13	0	0	0	14	11	6	0	20	0
 99 061022_Rus_Izh_CuO  	85	0	80	62	57,65	0	0	0	35	2	1	0	5	0
100 061022_StP_F21      	33	0	30	21	23,04	0	0	0	14	1	0	0	3	0
101 061022_Vla_JCC      	36	26	4	4	2,28	16	11	8,36	20	12	9	3	16	7
102 061025_Mos_Fs1      	29	0	25	21	20,7	0	0	0	15	1	0	0	4	0
103 061029_StP_F22      	10	0	10	9	7,64	0	0	0	6	0	0	0	0	0
104 061105_R18_Kaz      	66	0	60	46	44,87	0	0	0	22	5	4	0	6	0
105 061125_NNo_Ch       	40	0	21	20	17,79	0	0	0	16	9	4	0	19	0
106 061126_Kha_ChR      	50	47	2	1	1,09	28	15	16,23	20	7	2	0	20	0
107 061126_Per_Ch       	70	0	46	34	32,68	0	0	0	29	12	6	0	24	0
108 061210_Kha_CMP      	12	12	0	0	0	12	6	7,35	6	0	0	0	0	0
109 061212_Tat          	34	0	34	27	25,98	0	0	0	12	0	0	0	0	0
110 061217_Kha_CAM      	25	25	0	0	0	25	22	21,97	10	0	0	0	0	0
111 061218_RCF_NNo      	21	0	21	19	18,55	0	0	0	7	0	0	0	0	0
112 061220_NNo_TSC      	108	0	30	17	16,97	0	0	0	28	28	15	0	78	0
113 061220_RCM_NNo      	28	0	28	24	21,51	0	0	0	8	0	0	0	0	0
114 061224_Chl_Ch       	47	0	34	17	24,35	0	0	0	21	9	6	0	13	0
115 070107_Bar_Ch       	21	13	5	3	4,25	6	3	3,56	8	6	3	0	10	0
116 070107_R12_NNo      	72	0	66	49	43,02	0	0	0	24	7	6	0	6	0
117 070107_StP_Ch       	38	0	30	20	23,77	0	0	0	16	4	2	0	8	0
118 070113_Mos_BF2      	29	0	29	15	19,79	0	0	0	8	0	0	0	0	0
119 070210_StP_C4F      	16	0	9	5	6,25	0	0	0	9	5	2	0	7	0
120 070218_StP_CNY      	98	0	83	61	59,51	0	0	0	41	7	3	0	15	0
121 070224_Mos_Kido     	77	47	20	13	11,7	29	17	16,69	27	8	5	2	28	12
122 070225_RDo_CJU      	54	0	50	38	34,55	0	0	0	26	5	4	0	4	0
123 070228_StP_ChF      	37	0	37	27	26,68	0	0	0	10	0	0	0	0	0
124 070303_Nov_NGU      	34	32	0	0	0	18	7	9,7	19	14	7	0	16	0
125 070318_Mos_C4F      	41	0	25	15	16,26	0	0	0	19	8	3	0	16	0
126 070325_Rus_StP_JCC  	100	0	78	50	54,03	0	0	0	40	5	1	1	22	5
127 070402_Kaz_P12      	28	11	7	4	3,8	3	3	1,62	8	5	2	0	18	0
128 070405_Kaz_P18      	15	0	15	13	11,85	0	0	0	6	1	1	0	0	0
129 070414_StP_C2F      	20	0	16	13	11,85	0	0	0	10	1	0	0	4	0
130 070415_Izh_ChP      	60	0	51	39	36,69	0	0	0	24	3	1	0	9	0
131 070422_NNo_Cup      	75	0	60	43	44,78	0	0	0	30	4	1	0	15	0
132 070501_Chl_CUO      	105	0	55	35	38,01	0	0	0	42	22	9	0	50	0
133 070501_StP_ChF      	36	0	36	27	28,03	0	0	0	12	0	0	0	0	0
134 070504_Kaz_CPO      	84	0	75	58	56,73	0	0	0	34	3	1	0	9	0
135 070506_Kaz_Sh3      	55	3	40	35	31,89	2	2	1,42	22	6	3	0	13	0
136 070506_Pet_CFO      	30	0	18	14	11,98	0	0	0	12	6	3	0	12	0
137 070506_StP_Std      	32	0	18	15	14,17	0	0	0	16	13	8	0	14	0
138 070508_Mos_Ch2      	31	0	31	23	24,87	0	0	0	15	0	0	0	0	0
139 070520_Nov_CSO      	63	0	33	24	26,46	0	0	0	26	11	3	0	30	0
140 070530_Mos_ChF      	28	0	28	22	19,89	0	0	0	8	0	0	0	0	0
141 070629_ROC_Mos      	100	0	45	39	33,29	0	0	0	42	3	2	13	55	53
142 070630_Izh_ChF      	5	0	5	4	3,99	0	0	0	4	0	0	0	0	0
143 070704_RTC_StP      	60	0	60	46	48,57	0	0	0	30	0	0	0	0	0
144 070729_Bar_Alt      	53	39	9	5	6,75	25	20	16,08	19	12	7	0	19	0
145 070819_R25_Izh      	53	0	45	38	31,36	0	0	0	22	7	5	0	8	0
146 070825_Ufa_Ch       	25	23	0	0	0	4	3	2,56	12	7	3	3	21	12
147 070826_Kem_Kuz      	48	35	12	8	9,02	25	19	17,96	16	4	2	0	11	0
148 070902_Mos_Fes      	57	44	9	6	6,01	36	16	19,14	22	4	2	1	12	3
149 070915_Mos_FOL      	39	0	16	8	9,99	0	0	0	26	19	10	0	23	0
150 071007_StP_Osn      	35	0	30	25	23,64	0	0	0	16	2	0	0	5	0
151 071014_Izh_CuO      	142	0	67	47	45,55	0	0	0	58	36	15	0	75	0
152 071014_Mos_C18      	45	0	29	21	21,78	0	0	0	19	8	3	0	16	0
153 071021_Mos_JAC_Yth  	28	0	15	11	12	0	0	0	13	9	6	0	13	0
154 071021_Rus_Mos_JAC  	134	0	119	79	80,62	0	0	0	55	8	5	1	15	2
155 071105_Pet_ChK      	15	0	15	12	10,5	0	0	0	6	0	0	0	0	0
156 071106_R18_Chl      	122	0	108	80	76,68	0	0	0	42	4	3	3	14	10
157 071111_Nsk_NCh      	58	45	10	9	7,37	25	22	18,51	20	9	4	0	23	0
158 071118_Sib_CTSFO    	42	0	37	31	26,45	0	0	0	27	2	0	0	5	0
159 071123_RCF_NNo      	14	0	14	12	12,46	0	0	0	8	0	0	0	0	0
160 071128_RCM_NNo      	84	0	84	65	64,84	0	0	0	24	0	0	0	0	0
161 071202_Mos_TCM      	32	0	32	24	23,7	0	0	0	19	0	0	0	0	0
162 071209_Mos_C12      	30	0	8	6	4,96	0	0	0	13	13	7	0	22	0
163 071216_RDo          	13	0	4	2	2,55	0	0	0	10	8	4	0	9	0
164 071223_Mos_Chr      	18	15	3	2	2,3	13	4	7,05	11	1	0	0	2	0
Итого по всем турнирам  	8354	1227	5895	4294	4205	888	521	523,18	3313	661	326	65	1571	275



Если посмотреть на общие цифры по равным партиям, то кажется будто коррекция ухудшила соответствие частот вероятностным прогнозам, но на самом деле это не так. Во-первых, коррекция носила характер сжатия шкалы для большей части игроков, что не могло сильно отразиться на статистике равных игр. Во-вторых, основной вклад в расхождения частот и прогнозов вносят две группы: «Б/р» и «Б-3». Это группы, где в учитываемых парах один из соперников не имеет разряда и вполне мог получить недавно завышенную ЭО при первом входе в РС. Суммарно эти две группы дают 91 победу в разнице частоты и прогноза в общей статистике, что составляет даже несколько большее значение, чем разница в суммарной статистике частот (89). По общепринятым критериям отсеивания недостоверной статистики эти две группы должны быть удалены и не рассматриваться, т.к. относительные разницы для этих групп учета превышают стандартное отклонение биномиального распределения в среднем по двум группам более чем в три раза (в последней колонке приведены отношения разницы к средневероятному отклонению, примерно равному 2/3 от стандартного отклонения). Объединив в одну группу, получим, что разница побед и прогноза составила 90,6, а стандартное отклонение равно 19,6, т.е. более чем в 4 раза отклонение превосходит статистическую ошибку.

Таблица 3.
Сопоставление частот и вероятностных прогнозов для равных партий
Ожидаемое число побед:		с корр.	без корр.			
Группы учета	Партий 	Побед >	Nw_ожид	Nw_ож_1	R__сред	DR_сред	DN/E_b 
 <900   Б/р  	1113	703	641,37	641,36	331	199	5,474
        Б-3  	429	346	317,08	317,08	807	539	4,138
        Б-2  	121	114	114,89	114,89	1014	968	-0,239
        Б +  	50	50	50	50	1178	1524	0
  900   3р   	330	210	189,8	189,8	1135	140	3,295
        3-2  	411	316	299,58	299,57	1354	379	2,4
        3-1  	139	127	135,89	135,98	1527	797	-2,234
        3 +  	65	63	65	65	1605	1067	-0,735
 1400   2р   	390	223	225,86	225,86	1597	111	-0,429
        2-1  	384	291	295,46	297,71	1787	328	-0,674
        2-К  	135	125	133,28	134,03	1878	625	-2,111
        2 +  	51	49	51	51	1965	820	-0,83
 1800   1р   	373	220	219,95	222,29	1996	91	0,007
        1-К  	401	309	299,86	309,69	2124	219	1,353
        1-М  	219	205	210,44	214,63	2210	402	-1,09
        1-Г  	29	29	29	29	2258	594	0
 2150   КМC  	295	169	170,71	173,68	2246	59	-0,296
        К-М  	436	343	343,71	358,08	2337	192	-0,1
        К-Г  	105	96	104,11	104,75	2412	359	-2,345
 2350   МС   	162	99	98,75	100,97	2445	60	0,058
        М-Г  	186	156	159,26	164,13	2538	176	-0,708
 2550   Гр   	71	51	50,03	50,96	2645	71	0,343
Всего:      	5895	4294	4205	4250,46	1517	295	3,435

Удалив из статистики «плохие группы», получим в 4353 партиях 3245 побед при ожидаемых в скорректированной шкале 3246,6, т.е. разница всего 1/20 от стандартного отклонения. Какое еще лучше может быть совпадение частоты и прогноза? В то же время без коррекции шкалы получается прогноз 3292 и расхождение с частотой составляет 47 побед (около 1,5 стандартных отклонений).

В чем причина возникновения аномалии в самом низу шкалы? Во-первых, уже отмечалось, что неточная формула вероятностей РС-90 приводила к относительному завышению рейтингов самых слабых участников РС. Во-вторых, шкала рейтингов снизу не ограничена, но практика такова, что ниже 20-го кю как правило стартовые рейтинги не присваивались. Это приводило к тому, что ряд игроков входили в РС с завышенными рангами и впоследствии они оказывались в новой шкале как раз в районе границы «3р» (900 в новой шкале, 375 в старой) или немного ниже (но не ниже 600 по новой шкале).