ГоБиблиотека: Рейтинг/РФГ

Это старая версия Рейтинг/РФГ за 2008-09-30 01:19:40..
Раздел по российскому рейтингу, его истории и текущему состоянию.

Го (ГоКарта) => Го/Методики => Го/Методики/Рейтинг, РейтингКарта

Оглавление документа






[b]ВВЕДЕНИЕ[/b]

[quote] «Статистика знает все» – к/ф «Служебный роман», реж. Э.Рязанов[/quote]


Игра го обладает уникальным свойством, отличающим ее от всех других распространенных интеллектуальных игр: здесь широко применяется форовый принцип (или «принцип гандикапа»), позволяющий очень точно выравнивать шансы в играх между соперниками разного уровня мастерства. Такая особенность игры го очень важна в статистических расчетах, связанных с уточнением параметров рейтинг-систем (РС).

В любых единоборствах парные сопоставления (игры или партии) между участниками РС служат статистической базой для расчета рейтингов. При этом более сильный соперник побеждает чаще, априорная вероятность его победы в партии больше 0.5 и задается определенной функцией вероятностей, постулируемой в РС. На основе результатов множества партий все игроки распределяются с помощью заданного алгоритма РС в виде ранжировки по некоторому числовому параметру ("рейтинг-коэффициенту" или просто – «рейтингу»). Шкала рейтингов в той или иной РС является достаточно условной и можно вводить бесконечно много шкал и РС, которые будут давать примерно адекватные ранжировки, т.е. с достаточно правдоподобными соотношениями «силы игры», выражаемыми числовыми рейтинг-коэффициентами. Однако РС, позволяющие всех расставить в единой шкале независимо от того, насколько часто играются партии меду представителями разных регионов и клубов, практически не существуют в большинстве игр, за исключением игры го именно за счет использования в ней форового принципа.

Как же на практике принцип гандикапа позволяет построить единую универсальную шкалу в го? Фора реализуется в виде выставления более слабым соперником ряда камней на доску перед началом партии. Фактически это означает определенное преимущество, предоставляемое данной стороне за счет нескольких ходов «вперед». Так как результат игры определяется числом набранных каждой стороной очков и любой «правильный» ход в начале партии также оценивается определенным числом очков, примерно (в среднем) одинаковым для оптимальной игры при первых 10-15 ходах, то число камней форы может служить ориентиром для построения грубой шкалы «рангов», предположительно однородной и линейной. Если задать начальный фиксированный ранг какому-то одному стабильному игроку ("анкеру"), то за счет форовых игр с ним можно ранжировать сначала всех близких по уровню мастерства к даному анкеру, а затем и остальных участников – через форовые игры с уже ранжированными игроками. Такая шкала используется в го с давних времен и единственная в этом случае проблема – привязка шкалы к какой-то единой точке отсчета. Обычно сильнейшие профессиональные игроки Востока получают ранг 9 дан, затем к ним привязываются другие профессиональные игроки и сильнейшие любители – с шагом в один ранг вниз вплоть до 1-го дана, потом остальные более слабые – по шкале от 1 кю (на один ранг ниже 1-го дана) и далее в принципе неограниченно вниз с ростом ступеней кю. Сегодня в Японии и в большинстве других стран используется обычно 20 ступеней кю.

Под однородностью шкалы кю-данов понимается то, что преимущество в очках результата партии, определяемое форой, не зависит от расположения игроков на фиксированной шкале, а линейность означает одинаковый прирост очкового преимущества с ростом числа камней форы. Если постулировать линейность и однородность шкалы кю-данов и задать определенное число пунктов рейтинга на один ранг (обычно 100 пунктов), то можно получить числовую шкалу рейтингов с мелким шагом в один пункт (1/100 ранга), привязанную к сильнейшим профессионалам, в которой каждому рангу будет в среднем соответствовать целое число, кратное с множителем 100 номеру ранга. Такая шкала должна иметь точку отсчета, т.е. некоторый фиксированный сдвиг, определяемый условным максимальным значением, приписываемым виртуальному игроку, который никому не проигрывает. Предполагается, что такой «идеальный игрок» (сокр. «ИИ») не совершает ошибок в ходе партии, т.к. обаладает оптимальной стратегией, а такая стратегия всегда существуюет для игр типа го, что доказывается математическими методами. На основе описанного подхода и строятся сегодня рейтинговые шкалы и РС, используемые в разных национальных федерациях и международных организациях по игре го.

Итак, при построении современной РС в го, базирующейся на форовом принципе, требуется ответить на следующие вопросы:
– каково преимущество в результате партии, которое получают черные за счет права первого хода (величина «коми»);
– какова величина шага шкалы в пунктах рейтинга, соответствующая увеличению форы на один камень, и как шаг шкалы рейтинга связан с величиной коми;
– как выбрать точку отсчета шкалы рангов и согласовано с ней точку отсчета рейтингов;
– как выбрать для РС функцию вероятностей, зависящую от разницы рейтингов, уровней игроков и может быть других параметров, например характеризующих стабильность выступления того или иного участника РС в турнирах;
– как учитывать при расчете априорных вероятностей исходов партий принцип гандикапа;
– что считать «рейтинговым событием» и как выбирать интервал пересчета рейтингов ("рейтинговый период", соответствующий одному рейтинговому событию);
– какой выбрать алгоритм пересчета рейтингов по итогам рейтингового сыбытия;
– как задавать в РС стартовые рейтинги новым участникам и как компенсировать в алгоритме РС отток рейтинга от стабильных игроков к прогрессирующим;
– по каким критериям оценивать качество РС и как оптимизировать параметры.

Все выше перечисленные вопросы решаются на основе статистического анализа на больших выбрках партий с привлечением современных методов теории вероятностей и прикладной математической статистики, в том числе с проведением при необходимости численных экспериментов, моделирующих поведение конструируемой РС во времени. Часть из обозначенных проблем рассматриваются в последующих разделах, а некоторые, имеющие алгоритмический характер, изложены в описании РС РФГ(Б).


[b]КОМИ, ШАГ ШКАЛЫ И УЧЕТ ФОРЫ[/b]

Коми в равных партиях стало использоваться относительно недавно – только после образования Японской Ассоциации го ("Нихон-Киин") в 20-х годах прошлого века. Первоначально размер коми был принят в 4.5 очка и с таким коми играли вплоть до конца 70-х годов. Пол-очка являются условной величиной для определения победителя при равном счете очков.

Однако статистика равных партий между профессионалами Японии показала, что такое коми является недостаточной компенсацией белым и размер коми был увеличен до 5.5 очков. В 80-х годах в Японии неоднократно публиковалась статистика игр с новым коми, в соответствии с которой черные побеждали примерно в 60% партий. Теоретико-вероятностный анализ при некоторых предположениях о распределениях силы игры профессионалов дает для ошибки определения величины коми оценку примерно в 2-3 очка. Поэтому в 90-х годах постепенно перешли на коми 6.5 очка, а в некоторых турнирах сегодня уже применяется коми в 7.5 очка. В РФГ(Б), как и в большинстве национальных и международных организаций по игре го, в настоящее время принято коми в 6.5 очка.

Шаг рейтинговой шкалы не имеет существенного значения – важно только, чтобы он обеспечивал необходимую точность ранжировки игрооков. Обычно он выбирается кратным 100 и в большистве РС принята шкала 100 пунктов на ранг (кю или дан). Нестабильность силы игры и, соответственно, отклонений рейтинга обычно имеют порядок от нескольких десятков пунктов (доли ранга) для уровня данов до нескольких сот пунктов (2-3 ранга) – для нижних кю. Поэтому шкала с шагом в 100 пунктов на ранг имеет достаточно мелкую «цену деления», чтобы обеспечить адекватную оценку уровня игры по рейтингу.


[b]ТОЧКА ОТСЧЕТА ШКАЛЫ И ФУНКЦИЯ ВЕРОЯТНОСТЕЙ[/b]

Со времен А.Эло, который начал свои исследования по РС в 60-х года прошлого века, принято шкалу рейтинга для логических игр типа шахмат, шашек или го брать в диапазоне 0-3000 пунктов. Выбор максимальной точки отсчета не имеет существенного значения – можно взять для этой отметки шкалы любое другое число, например 4000 или еще какое подходящее значение. Главная цель любой РС – ранжировка участников по силе игры относительно друг друга, а сдвиг шкалы не меняет ранжировку. В частности, шкала может быть и неограничена сверху или снизу.

Однако для логических игр двух лиц с полной информацией, к которым относятся шахматы, шашки, го и многие другие игры, справедлива теорема о существовании оптимальной стратегии. Игрок, обладающий такой стратегией (идеальный игрок, сокр. ИИ), не совершает ошибок и при равных стартовых условиях в партии не может проиграть. С другой стороны, реальные игроки совершают ошибки и результат партии определяется тем, кто меньше суммарно совершит ошибок (с учетом их значимости). В играх с качественным исходом партии (мат в шахматах, уничтожение материала соперника в шашках) не имеет особого значения, какой рейтинг приписать ИИ, в том числе его можно принять и бесконечно большим.

В го результат партии определяется очками, набранными соперниками, и ИИ должен набирать максимально возможную сумму, которая может в практических целях считаться ограниченной сверху, в то время как реальный игрок совершает ошибки почти при каждом из 120–150 ходов в партии. Результат партии в го, таким образом, определяется разницей набранных очков, вернее разницей суммарно сделанных соперниками ошибок, и каждый ход или его ошибочность могут теоретически быть оценены также в очках результата. При этом результат всегда конечен, а шкала рейтингов, согласованная со шкалой рангов, имеет также конечные оценки по разнице набираемых соперниками очков. Известно также, что с ростом мастерства уровень и частота совершаемых при отдельных ходах ошибок в среднем снижаются, а у ИИ уровень ошибок всегда равен 0. Поэтому правдоподобным выглядит предположение о конечности рейтинга ИИ, а рейтинг реальных игроков может неограниченно приближаться к этой отметке, никогда ее не достигая. Т.е. рейтинг ИИ должен быть конечным и являться асимптотическим значением на шкале рейтингов.

Исходя из выше изложенного, необходимо при построении РС для го после определения шага шкалы выбрать отметку, которая будет соответствовать рейтингу ИИ. Можно назначить такую точку отсчета произвольно, но можно исходить и из существующих ранжировок игроков и подбирать адекватное значение рейтинга ИИ на основе анализа статистических данных. Именно так и поступили в ЕГФ в 1998 году, когда приняли РС Чешской Ассоциации го (автор А.Чеплы). База партий ЕГФ содержала на тот момент более 100 000 партий, в том числе около 12% партий с гандикапом.


[b]МОНИТОРИНГ РС НА ОСНОВЕ СТАТИСТИКИ ПАРТИЙ[/b]

Какую РС в го, базирующуюся на форовом принципе, можно считать идеальной? Очевидно такая РС должна давать прогнозы результатов партий, незначительно отклоняющиеся от наблюдаемых частот побед/поражений, т.е. в среднем по всей шкале отклонения частот от прогнозов должны находиться в пределах статистической погрешности, а заданный шаг шкалы (у нас принято 100 пунктов на ранг) должен правильно отражать форовые соотношения между игроками, т.е. при точно выбранной по разнице рейтингов форе частоты должны сходиться к 50%. Обычно фора задается неточно (с недобором в пользу белых), поэтому частоты в форовых играх просто должны быть адекватны прогнозу, вычисленному по рейтинговой разнице между соперниками с учетом даваемой форы. Если играются в достаточном количестве форовые игры, то шкала в большей своей части сохраняет правильные форовые соотношения даже при неправильной формуле вероятностей, что подтверждается на статистике ЕГФ (12% форовых партий), где ведется мониторинг выполнения форовых соотношений, показывающий хорошее согласие с условием «100 пунктов рейтинга на один ранг», в то время как статистика равных партий показывает значительные расхождения частот от прогнозов (в некоторых случаях более 10%, что на статистике в тысячи партий в группах по рангам в несколько раз превышает допустимую статистическую погрешность).

В России в период с 1985 по 2005гг. практически не проводились форовые рейтинг-турниры. Коме того, формула вероятностей, принятая в РС-90, была выбрана на основе статистики равных игр 1-5 данов и не годится для всей шкалы от 7 дана до 20 кю. Кроме того, параметры функции вероятностей РС-90 постоянны и одинаковы для всех уровней игроков. Поскольку обычно во всех РС имеется еще и переток рейтинга от стабильных игроков к растущим, то можно было ожидать, что статистика российских партий за 2005–2007гг. позволит выявить какие-либо деформации в шкале рейтингов. Ниже перечислим еще раз основные факторы, влияющие на возникновение деформаций, и рассмотрим механизмы действия этих факторов на шкалу рейтингов.

[b][i]Фактор 1. Отсутствие форовых рейтинг-партий.[/i][/b]
[b][i]Фактор 2. Неправильная формула вероятностей.[/i][/b]
[b][i]Фактор 3. Переток рейтинга от стабильных игроков к растущим.[/i][/b]

Как уже отмечалось, без учета в рейтинге форовых партий реальная шкала рейтингов не может быть адекватной условию постоянства во всех частях шкалы шага в 100 пунктов рейтинга на один ранг традиционной лестницы кю-данов. Действительно, все формулы вероятностей с точностью до величин третьего порядка от разницы рейтингов инвариантны для равных партий относительно растяжений-сжатий шкалы с центром в рейтинге ИИ (точка отсчета шкалы, у нас 3000) и такие деформации не могут быть обнаружены «изнутри системы». Если играются только равные партии, то рейтинги стремятся постепенно занять положение, при котором частоты совпадают с вероятностями, какой бы неправильной не была сама формула, и шаг становится отличным от 100. Таким образом, если формула задана с ошибкой, то возникает деформация шкалы со следующим механизмом ее формирования.

Рассмотрим формулу вероятностей РС-90 и возьмем середину шкалы. Пусть изначально шкала адекватна лестнице рангов и вообще правильная, а игрок с рейтингом 1000 (11 кю) встречается попеременно с соперниками выше его на один ранг, которым проигрывает, и ниже его на один ранг, у которых выигрывает. Ошибка формулы вероятностей в этом случае составляет около 11% и симметрична: вероятность победы по предположительно правильной формуле РС-2005 составляет 55% во встречах с более слабыми, 45% – с более сильными. Формула РС-90 дает соответственно 66% и 34%. В итоге при коэффициенте динамичности 100 (это значение не принципиально, для простоты берем круглое число) получим, что при выигрыше у более слабого в РС-90 игрок недополучает при пересчете 100 х 0,11 = 11 пунктов рейтинга. Но точно на такую же величину игрок теряет меньше чем положено при проигрыше старшим, т.е. шкала в средней части в обычных условиях стабильной игры не деформируется, хотя колебания рейтинга по амплитуде существенно увеличиваются по сравнению со случаем применения правильной формулы. Для рассмотренного примера: при 20 партиях с более слабыми и таком же числе с более сильными ожидаемое число побед и поражений соответственно 11/9, при совпадении частот с прогнозом при правильной формуле изменение рейтинга в обоих случаях равно нулю, а по формуле РС-90 -202 и +202 соответственно (в сумме тоже 0).

Однако на краях шкалы симметрия нарушается: снизу игрок обычно встречается в основном с более старшими по рейтингу, и хотя чаще им проигрывает, но при этом у него отбирается меньшее число очков, чем положено по правильной формуле, а при более редких выигрышах он получает лишние очки. В итоге баланс рейтинга самого нижнего участника РС даже без роста мастерства оказывается положительным и рейтинг слабейших в РС игроков начинает расти. Затем избыток рейтинга может частично или полностью поглащаться естественным в этой части шкалы ростом мастерства или просто перераспределяется среди чуть более сильных соседей, и тогда этот процесс оттока рейтинга к самым слабым компенсируется снижением рейтинга остальных участников РС, в основном в нижней части шкалы, т.е. эта часть шкалы растягивается книзу с уплотнением шкалы вблизи рейтинга самых слабых.

Вверху шкалы ситуация прямо противоположная, за исключением того, что избыток рейтинга, получаемый лидерами, никуда рассосаться уже не может, т.к. им присуща стабильность в игре и они сохраняют лидирующие позиции длительное время. В итоге лидеры начинают отрываться по рейтингу от остальной группы чуть более слабых стабильных игроков, [i]снижая их средний рейтинг[/i]. Это явление было подтверждено экспериментально в РС-90 при анализе рейтинга А.Динерштейна: его российский рейтинг по РС-90 в 2003 году был уже 2878, что превышало его европейский рейтинг 2762, примерно адекватный в среднем в этой части шкалы российскому рейтингу, на 116 пунктов. После экспертной оценки в 2800 пунктов, сделанной в 2005 году для нового проекта РС-2005, он сохранил в последующие 3 года тот же уровень с незначительным снижением рейтинга (в пределах 20-25 пунктов), причем рейтинги в ЕГФ и РФГ(Б) у А.Динерштейна очень близки в течение всего рассматриваемого периода (обе формулы вероятностей в области 6-7 данов дают близкие прогнозы).

Чтобы еще раз наглядно представить скорость отрыва лидера в РС-90, рассмотрим обычного среднего соперника А.Динерштейна в российских турнирах – это как правило игрок 5-6 дана, отстающий от него в среднем на 2 ранга (200 пунктов). Если принять стартовый рейтинг Динерштейна в 2700 пунктов (конец 90-х годов), а его соперника – 2500, то их средний рейтинг равен 2600 (400 пунктов от ИИ) и вероятность победы старшего по РС-2005 будет 100%, а по РС-90 только 80%. Таким образом, выиграв 10 партий у 5-х данов, Динерштейн зарабатывал около 20 пунктов рейтинга просто так, за счет ошибки формулы вероятностей. Поэтому нет проблемы лет за 5 набрать 100 «лишних» пунктов. Заметим еще раз, что такой процесс отрыва лидера приводит к снижению среднего рейтинга основной части игроков дан-уровня без реального снижения уровня игры, и эта волна деформации постепенно смещается вниз шкалы.

Следует еще раз подчеркнуть, что описанные выше процессы дефоромации шкалы играют существенную роль только именно в случае отсутствия учитываемых в РС форовых партий. Так как фора сводит все вероятности побед/поражений примерно к 50% независисмо от конкретного вида функции вероятностей, применяемой в той или иной РС, то ошибки данного вида подавляются при пересчете форовых партий и форовый принцип, таким образом, является мощным стабилизатором всей рейтинговой шкалы.

Последний из рассматриваемых факторов – рост мастерства игроков – так же приводит в целом к деформации шкалы типа растяжения, т.к. растущий игрок отнимает лишние пункты рейтинга в основном у более старших, и продвигаясь по шкале вверх вплоть до своего уровня стабилизации может суммарно отнять у стабильных игроков тысячи пунктов рейтинга. В самом деле, пусть игрок вошел в РС с рейтингом 1000 (11 кю), а стабилизировался на уровне 2000 (1 кю). Тогда этот прирост в 1000 пунктов, если не было экспертных оценок и аномалок, полностью получен за счет отбора примерно такого же количества пунктов у остальных игроков (сначала только у соперников, с которыми встречался растущий, а потом этот дефицит рейтинга перераспределяется между всеми остальными участниками). Если в РС кроме растущего еще 10 стабильных игроков, то они понизятся в рейтинге каждый на целый ранг! При 100 игроках среднее снижение уже не так заметно – всего 10 пунктов. Однако при достаточном количестве в РС растущих игроков стабильные игроки постоянно теряют рейтинг. По оценкам для РС-90 эта скорость потери рейтинга стабильной группой данов составляла до 20 пунктов в год и за 15 лет эксплуатации РС общие потери рейтинга достигали порядка 300 000 пунктов.

Описанные выше механизмы деформации полностью подтверждаются статистикой: проведенная в начале 2008 года коррекция шкалы, основанная на статистическом анализе всех сыгранных в РС партий, хорошо исправляет ситуацию по статистике для 164 турниров 2005–2007гг. В 37 турнирах 2008 года эффективность коррекции также подтвердилась: имеется хорошее совпадение частот с прогнозами (сдвиги для скорректированых рейтингов находятся в пределах статистической погрешности, в то время как статистика без коррекции шкалы на том же наборе партий дает расхождения в несколько раз большие). Более того, анализ статистики показал, что уже к концу 2005 года расхождения частот и прогнозов стали уменьшаться за счет резкого увеличения числа форовых игр (18% в 2005 году, в среднем 13% в последние три года), а также за счет применения более правильной функции вероятностей и использования более динамичного алгоритма, основанного на усовершенствованном методе аномальной коррекции и применении формул Гликмана с индивидуальными отклонениями рейтинга. Но скорость такой сходимости крайне низка, в последующие два года скорость автокоррекции упала и для исправления шкалы внутри самой РС без коррекции административным способом пришлось бы ждать лет 10-15, т.е. примерно столько же, сколько деформации накапливались.


Здесь следует сказать сразу же и о выборе функции вероятностей, т.к. обработка статистики партий часто осуществляется с учетом прогнозируемых исходов. Исторически в первой РС Эло, внедренной в ФИДЕ в начале 70-х годов, была принята формула с дробно-экспоненциальной зависимостью вероятностей исходов от разницы рейтингов. Это семейство функций, асимптотически выходящих на 0 и 1 соответственно при бесконечно большой отрицательной и положительной разнице рейтингов, имеет два свободных параметра. Графики таких функций симметричны относительно средней точки, где вероятность равна 0.5, и общее наименование класса – логистические кривые. Формула вероятностей на основе логистической кривой для парных сопоставлений впервые была предложена в 1953 году (модель Брэдли-Терри). Она выводится теоретически из предположения о транзитивности отношения частот побед (подробнее – см. сайт ЕГФ например), а статистического обоснования для игр, похоже, не существует.

Само по себе предположение о транзитивности отношений частот является далеко не очевидным и поэтому не подходящим для постулирования при построении РС. Любое другое предположение, например о нормальном поведении распределения вероятностей, ничем не хуже. Более того, интеграл Гаусса является интегро-экспоненциальной функцией с аналогичными свойствами, что и у логистической кривой, и они могут использоваться для взаимной аппроксимации (возможно, что логистические кривые появились вообще из экспериментов над случайными нормально распределенными величинами как упрощение интеграла Гаусса).

Теоретико-вероятностный анализ показывает, что для асимптотических свойств сходимости РС к адекватной ранжировке вид функции вероятностей не так важен. Однако в практических целях достоверного прогнозирования исходов роль правильного выбора функции вероятностей невозможно переоценить. Как же выбрать функцию вероятностей, если ничего практически неизвестно об индивидуальных распределениях силы игры участников РС? И тут снова игра го оказывается в исключительном положении, опять благодаря все тому же форовому принципу.

Если начальное распределение рейтингов произвольно и задана какая-то формула вероятностей и нет других механизмов извлечения информации, кроме парных сопоставлений (без форы или иных коррекций разницы в рейтингах), а все игроки уже стабилизировались и не меняют своего уровня, то вероятно распределение рейтингов будет сходиться к некоторому равновесному состоянию, где все наблюдаемые частоты побед будут в среднем совпадать с ожидаемыми исходами, рассчитанными по заданной формуле вероятностей. Скорость такой сходимости крайне низка, но гораздо важнее то, что в го есть совершенно другой механизм стабилизации, на порядок более эффектиный: это форовые игры.

Действительно, в го начальные распределения рангов (и порождаемых ими рейтингов) фактически всегда довольно точно соответствуют правильным форовым соотношениям. То же самое как правило справедливо и для новых игроков, т.к. их экспертные оценки обычно основываются на играх с форой. Правильность форовых соотношений в шкале рангов (рейтингов) является очень устойчивым признаком, если играется достаточное количество форовых партий. Устойчивость определяется тем, что фора обычно выбирается близкой к реальному соотношению рангов и вероятности исходов приближаются к 0.5 независимо от вида заложенной в РС формулы вероятностей. Т.е форовый принцип подавляет ошибки формулы вероятностей, и из статистики равных партий в сообществе игроков с правильными форовыми соотношениями можно получить информацию об истинном виде распределения вероятностей. Это фундаментальный вывод, подтверждающийся экспериментально: в ЕГФ хорошо выполняются форовые соотношения, что регулярно проверяется и подтверждается при мониторинге РС, однако формула вероятностей, основанная на логистической кривой, дает большие расхождения с наблюдаемыми частотами в равных партииях и это расхождение никак не уменьшилось за последние 5 лет, хотя объем статистики из более чем 108000 партий за тот же период вырос примерно в полтора раза.

С другой стороны, в России прекратили учитывать в рейтинге форовые партии примерно лет 20 назад и за период вплоть до введения нового проекта РС-2005 форовые соотношения не могли не подвергнуться существенным искажениям, т.к. формула вероятностей, применявшаяся в тот же период, не была достаточно правильной (область корректного ее применения была очень узкой по диапазону рангов), мониторинг РС не осуществлялся и не контролировались никак возможные деформации шкалы рейтингов. Наличие деформаций было выявлено позже в 2008 году, после того как принятый новый проект РС-2005 отработал 3 года и был накоплен свежий статистический материал.

Поскольку статистика ЕГФ, как показано выше, пригодна для выявления истинных вероятностных соотношений, то такая работа по статистическому анализу была проделана в 2003 году и было выяснено, что наиболее подходящим для выбора функции вероятностей из достаточно простых классов кривых является дробно-гиперболическое семейство. В общем виде формула вероятностей по проекту РС-2005 содержит постоянный член 0.5 и добавок в виде дроби, в числителе которой стоит разница рангов (рейтингов), а в знаменателе – некоторое среднее расстояние партнеров по шкале рейтинга от точки отсчета – рейтинга ИИ. Сравнение средних частот по всем рангам при средней разнице между партнерами в 1, 2 или 3 ранга дало очень хорошее согласие при простых коэффициентах базовой формулы, и только при разнице в 4 ранга было более существенное расхождение, превышающее допустимую статистическую погрешность. Последующие повторные сопоставления частот и ожидаемых результатов на расширенной статистике ЕГФ показали такое же хорошее согласие – за прошедшие 5 лет не изменилось практически ничего.

В заключение следует сказать, что такой вид формулы вероятностей можно вывести и теоретически из аппроксимации нормального распределения вероятностей. А нормальный вид функции вероятностей вполне естественен, учитывая большое число совершаемых в партии ходов. В этом случае вполне вероятно выполнение условий применимости центральных предельных теорем теории вероятностей, и тогда сумма случайных величин, каковыми являются ошибки соперников, совершаемые ими в ходе партии, должна быть асимптотически нормальной.


Размер правильного коми, т.е. обеспечивающего выравнивание шансов сторон при игре без форы, является внутренним свойством самой игры и в равной партии двух ИИ очковый результат игры должен быть в пользу черных ровно на величину коми (с точностью до условных пол-очка). К сожалению, определить теоретически точное значение правильного коми или экспериментально проверить адекватность используемого значения с абсолютной достоверностью практически невозможно. Остается только проводить мониторинг на основе статистики партий сильнейших профессионалов и наблюдать за согласием частот побед с ожидаемыми 50%. Однако на такую статистику влияет ряд факторов субъективного характера и прогресс в теории игры, и вполне возможно, что размер принятого на практике коми еще будет уточняться.

Между разницей в рангах (или рейтингах) двух игроков и ожидаемым средним очковым результатом партии между ними при не очень большой разнице в рангах имеется практически 100% корреляция. Поэтому правильное коми также должно соответствовать определенной разнице рейтингов. Если предполагать линейность и однородность шкалы рейтингов, то правильное коми должно быть эквивалентно половине шага шкалы (50 пунктов рейтинга при шаге шкалы в 100 пунктов на ранг). Т.е. два игрока с разницей уровней в пол-ранга (50 пунктов рейтинга) в партиях без коми, когда черными играет более слабый соперник (фора 1), должны иметь равные шансы и частота побед любой из сторон при росте числа партий обязана приближаться к 50%. Сформулированное выше утверждение о соответствии правильного коми половине шага шкалы рейтингов доказывается следующим образом.

По предположению о линейности, нарастание очкового преимущества при добавлении камней форы происходит всегда на одно и то же число. Адекватная новой форе разница рангов увеличивается на соответствующее целое число, а разница рейтингов – на кратное добавленной разнице рангов (или добавленных камней форы) с коэффициентом 100 (зафиксируем такой шаг шкалы). Из симметрии ситуации при смене цвета соперников в игре без форы и без коми ясно, что размер коми должен соответствовать половине разницы ожидаемых очковых результатов партии при игре черными и белыми соответственно, т.к. переход от игры черными к игре белыми соответствует изменению ожидаемого результата партии на два коми. С другой стороны, добавление камня форы можно рассматривать как пас белых, и аналогично смена цвета эквивалентна пасу черных. Следовательно, смена цвета (два коми) эквивалентна разнице в один ранг, и коми в пунктах рейтинга эквивалентно половине шага шкалы.

Таким образом, при построении РС, согласованной с принципом гандикапа, необходимо учитывать, что фора в камнях эквивалентна разнице рейтингов пропорционально числу камней форы со сдвигом на полкамня (полранга), т.е. сдвиг эквивалентен одному коми, или 50 пунктов рейтинга при шаге шкалы 100 пунктов на ранг. Для обычно используемой форы от 1 до 9 камней получаем следующее соответствие между форой и адекватной ей разницей рейтингов: фора 1 (право первого хода без коми) = 50 пунктов, фора 2 (пас белых после первого хода черных) = 150, ..., фора 9 (8 пасов белых) = 850. Соответственно ожидаемый результат партии без форы между игроками разных рангов пропорционален удвоенному коми и составляет 13-15 очков на один ранг разницы в уровнях игры, если исходить из принятых на практике величин коми. Этот вывод хорошо согласуется с данными, известными из разных источников, по которым оценка очкового преимущества черных при форе в 9 камней составляет порядка 130–140 очков. Если вспомнить о том, что коми 5.5 было предположительно определено с ошибкой в 2-3 очка в пользу черных, то для форы 9, эквивалентной 850 пунктам разницы в рейтинге или 17 коми, получим оценку ~ 127 очков при коми 7.5, 136 очков при коми 8.

В заключение раздела кратко опишем, как фора в камнях учитывается при вычислении прогнозируемых результатов в РС. Обычно формула вероятностей (см. следующий раздел) задается в виде функции от разницы рейтингов соперников и может зависеть еще от ряда параметров, характеризующих, например, уровень стабильности игроков или иных характеристик. Фора сокращает разницу в прогнозируемом результате партии в очках, поэтому ее эквивалент в пунктах рейтинга просто вычитается из разности рейтингов. Таким образом, если встречаются два игрока с разницей в рейтингах, кратной рейтинговой величине коми (50 пунктов при шаге шкалы 100), то можно установить точную фору в камнях, которая выравнивает шансы сторон. Например, при разнице в 50 пунктов правильная фора должна быть 1 камень, при 150 – два камня и т.д. Если фора задана в камнях без дополнительной компенсации несоответствия разницы рейтингов и рейтингового эквивалента форы (такая дополнительная компенсация тоже называется коми, которое может быть вообще говоря произвольным – в зависимости от условий проведения турнира), то ожидаемый результат будет отличаться от 0.5, и точное значение вероятностей победы или поражения определяется с помощью формулы вероятностей и с учетом рейтингового эквивалента форы как описано выше.


СТАТИСТИЧЕСКИЕ ОСНОВЫ РЕЙТИНГ-СИСТЕМ

[b]СТАТИСТИКА ТУРНИРОВ[/b]

[b]1. Вводные замечания[/b]

Для корректной обработки статистики турниров по го необходмо прежде всего выделить группы учета партий по уровням мастерства соперников. Здесь возможны два подхода:
– группировать партии по средним рангам соперников;
– группировать партии по равномерной вероятности побед/поражений в равных партиях для средних представителей из соседних групп.
При первом подходе традиционно принято для минимальных групп учета принимать партии игроков примерно одного ранга, затем к ним добавляются группы партий по увеличивающейся на один ранг разнице в силе игры. В этом случае базовыми группами учета будут партии на равных между игроками одного ранга, потом партии игроков, отличающихся на один, два, три, четыре ранга и т.д. Это самое мелкое деление шкалы рейтинга, которое используется на практике для статистического учета партий в го. Недостатком такого подхода является неравномерность вероятностей по шкале рангов для различных групп по уровням игры при фиксированной разнице в рангах соперников. Это обусловлено тем, что вероятности побед зависят не только от разницы в силе игры, но и от уровня соперников.

Первый подход является традиционным и используется в статистике Еврропейской Го Федерации (ЕГФ) и ниже приводятся примеры такой статистики.

Второй подход, принятый нами в качестве основного, более удобен, так как в этом случае вероятности в различных группах учета при фиксированной разнице рангов в среднем оказываются примерно одинаковыми по всей шкале. В го имеется естественная разбивка игроков по разрядам Единой Всероссийской Спортивной Классификации (ЕВСК). За основу разрядной сетки взята вероятность победы в 80% при встрече среднего игрока какого-либо разряда со средним соперником из разряда на одну ступень ниже, при этом вся шкала разбивается на следующие разряды по рейтингу:
б/р – до 900,
3р – 900–1399,
2р – 1400–1799,
1р – 1800–2149,
КМС – 2150–2349,
МС – 2350–2549,
Гр – 2550 и выше.

Разбивка на группы на основе разрядной сетки лучше подходит для целей статистического учета партий в российских турнирах еще и потому, что в этом случае обеспечивается достаточное наполнение групп, т.к. в целом выборка партий не настолько объемна, чтобы можно было вводить более мелкие группы учета по рангам. Аналогичный подход к выделению групп учета принимается и для партий на форе, только число групп увеличивается за счет разбиения базовых групп на подгруппы по форе от 1 до 9. В некоторых случаях вводятся также укрупненные группы учета (нижняя и верхняя части шкалы рейтинга с границей по рейтингу 1500).

Основное внимание при анализе статистики следует обращать на разницу частот и вероятностных прогнозов, т.к. эта характеристика является главным критерием качества статистической модели, заложенной в основу рейтинг-системы (РС). Кроме того, различные группы учета имеют неодинаковую значимость для оценок качества РС: наиболее важными являются группы из верхней части шкалы, т.к. игроки из этой группы являются наиболее стабильными участниками РС и выступают в роли анкеров по отношению к остальным участникам. В форовых партия наиболее важными являются группы с форой до 4 камней, т.к. здесь можно рассчитывать на хорошее соблюдение условия линейности форы, а при большей форе могут проявляться особенности, не достаточно изученные на данное время.

Отдельно следует отметить особенности учета партий игроков с экспертными оценками (ЭО) уровня игры. Часть игроков получает ЭО при первом входе в РС, но есть игроки, которые имели перерыв в выступлениях, за время которого существенно повысили свой уровень и поэтому также получали ЭО, которые принимались за их новый стартовый уровень при пересчетах рейтинга. К этой группе примыкают игроки, которые не входят в РС (т.н. «внешние», в основном иностранные участники российских турниров) и их партии учитываются только в целях пересчета рейтинга игроков из РС. По указанным группам участников ведется дополнительная статистика, а игроки с подтвержденными ЭО, т.е. показавшие по результатам пересчитываемого турнира неотрицательное измененение рейтинга, учитываются в статистике наравне с обычными участниками РС. Необходимость отдельного учета неподтвержденных ЭО объясняется тем, что анализ статистики показывет значительное в среднем завышение ЭО по сравнению с реально достигнутым уровнем игры. Таким образом, вся статистика имеет следующую структуру: в основные группы учета входят партии между участниками из РС, включая игроков с подтвержденными ЭО, и отдельно ведется учет партий между игроками с ЭО и соперниками из РС (включая игроков с подтвержденными ЭО), а также дополнительно ведется учет всех партий игроков с неподтвержденными ЭО и внешних (правая сторона в таблицах по группам учета).

Все рейтинги и, соответственно, группы учета в статистических таблицах указываются с учетом проведенной в начале 2008 года коррекции шкалы. Параметры, относящиеся к старой шкале (вероятностные прогнозы, средние рейтинги соперников и их разница) указываются в отдельных колонках (ожидаемые результаты – с индексом 1).

[b]2. Сравнительный анализ вероятностных функций в РС ЕГФ и РФГ(Б)[/b]

Вероятностная функция в той или иной РС является частью статистической модели и выбирается на основе специальных теоретических исследований или статистического анализа на больших выборках партий. Традиционно, начиная с шахматной РС А.Эло (1970), для формулы вероятностей в логических играх как правило выбирают кривую из семейства гауссовых распределений (интеграл Гаусса, т.е. нормальное распределение с экспоненциальной плотностью), или кривую с дробно-экспоненциальной зависимостью вероятностей победы от разницы рейтингов (класс так называемых «логистических кривых»). В РС ЕГФ выбрана логистическая кривая с двумя свободными параметрами, уточняемыми на основе статистического анализа. Класс нормальных распределений также является двупараметрическим, и оба класса могут использоваться для взаимной аппроксимации при подходящем выборе параметров в заданном интервале значений рейтингов. Статистика равных партий в какой-либо узкой группе по рейтингу в данной РС задает одно условие на параметры, а второе условие обеспечивается статистикой форовых партий, так что для двупараметрических семейств распределений этой информации вполне достаточно для полного определения статистической модели РС с зависимостью вероятностных формул как от разницы рейтигов, так и от уровней игроков при фиксированном классе распределений.

Поскольку анализ статистики ЕГФ (более 100 000 партий на момент разработки проекта РС-2005) и регулярно проводимый в ЕГФ мониторинг показали, что форовые соотношения в РС ЕГФ соблюдаются достаточно точно (в пределах статистической погрешности), то статистика ЕГФ пригодна для уточнения параметров вероятностных распределений как для форовых, так и для равных партий, если выбран какой-либо подходящий двупараметрический класс кривых (не обязательно только нормальных или логистических).

Соблюдение в РС правильных форовых соотношений означает, что вероятности побед/поражений при правильной форе близки к 50% независимо ни от разницы рангов, ни от расположения соперников на шкале рейтингов (рангов). В этом случае статистика партий на форе практически не зависит от не очень больших линейных сдвигов шкалы (при фиксированной точке отсчета, соответствующей рейтингу идеального игрока, сокр. ИИ), а статистика равных партий характеризует истинные вероятностные соотношения в совокупности игроков независимо от выбора формулы вероятностей в РС, т.к. форовые соотношения от вида функции вероятностей не зависят. С другой стороны, обычно применяемые формулы вероятностей инвариантны с высокой точностью относительно растяжений-сжатий всей шкалы с центром в рейтинге ИИ, принимаемом за относительную точку отсчета рейтингов. В наиболее часто используемых абсолютных шкалах рейтингов обычно эта точка не ниже 3000 пунктов.

Исходя из выше изложеного, в 2003 году было проведено статистическое исследование выборки партий ЕГФ на предмет определения подходящего для формулы вероятностей двупараметрического класса функций и уточнения конкретных значений параметров. Оказалось, что частоты в равных партиях для фиксированной разницы в уровне соперников 1, 2, 3 и 4 ранга качественно ведут себя одинаково: кривые частот имеют гиперболический вид, а при обращении частот (замена зависимой переменной – частоты Y – на обратную величину Z = 1/Y) эти кривые переходят в прямые, сходящиеся примерно в одной точке на оси рейтингов, которая имеет физический смысл рейтинга ИИ. Вычисленное на данной выборке с использованием метода наименьших квадратов значение рейтинга ИИ с высокой точность оказалось равно 3000 пунктов. Сами так полученные статистические прямые имели углы наклона с высокой точность соответствующие линейному приращению частот при переходе с одной прямой на другую. Поэтому для проекта РС-2005 был выбран класс непрерывных монотонных и симметричных по разнице рейтингов кривых, состоящих из трех кусков: константы 0 и 1 на достаточном удалении по разнице рейтингов от точки симметрии, где эта разница равна 0 и вероятность P = 0.5, а в средней части между этими предельными значениями используется линейно-гиперболическая формула зависимости вероятности от разницы рейтингов (в числителе дроби, прибавляемой к 0.5) и среднего уровня пары (расстояние пары от рейтинга ИИ в знаменателе дроби).

Описанный выше класс кусочно-гладких кривых при не очень больших разницах рейтингов является хорошей аппроксимацией как для класса нормальных распределений, так и для класса логистических кривых при согласованном выборе параметров. Ниже в качестве иллюстрации приводится сопоставление частот с вероятностями по формуле ЕГФ и принятой в РС-2005 формуле – на статистике партий ЕГФ, в которых на равных встречались соперники со средней разницей уровней в один ранг.

[b]Таблица 1.[/b]

[i]Сравнение частот побед в равных партиях с вероятностными прогнозами по формулам ЕГФ и РФГ при средней разнице в 1 ранг
Приведены частоты побед более слабого в усредненных по рангам парах соперников[/i]

P_егф – вероятность по формуле ЕГФ
P_рфг – вероятность по формуле РФГ
[code]
Ранг R1 R2 DR Dcp Побед Партий Статвес Частота P_егф Сдвиг С весом P_рфг Сдвиг С весом
14K 694,3 791,3 97 2258 569 1249 0,01603 45,6 38,2 7,3 0,12 45,7 -0,1 -0,0016
13K 787,9 881,2 93,3 2166 617 1397 0,01793 44,2 38,1 6 0,11 45,7 -1,5 -0,0269
12K 883,8 966,5 82,7 2075 673 1471 0,01888 45,8 39,3 6,5 0,12 46,0 -0,2 -0,0038
11K 974,4 1066,2 91,8 1980 881 1883 0,02417 46,8 37,8 9 0,22 45,4 1,4 0,0338
10K 1072,4 1155,4 83 1887 1145 2561 0,03287 44,7 38,6 6,1 0,20 45,6 -0,9 -0,0296
9K 1164,3 1257,8 93,5 1790 1171 2594 0,03330 45,1 37 8,1 0,27 44,8 0,3 0,0010
8K 1265,4 1347,5 82,1 1694 1222 2779 0,03567 44 38,2 5,8 0,21 45,2 -1,2 -0,0428
7K 1356,1 1442,9 86,8 1601 1429 3203 0,04111 44,6 37,2 7,4 0,30 44,6 0 0
6K 1455,3 1548 92,7 1499 1691 3949 0,05069 42,8 36 6,8 0,34 43,8 -1 -0,0507
5K 1554,8 1641,7 86,9 1402 1945 4361 0,05600 44,6 36,2 8,4 0,47 43,8 0,8 0,0448
4K 1654 1742,8 88,8 1302 2232 4921 0,06317 45,4 35,5 9,9 0,63 43,2 2,2 0,1390
3K 1753 1842,5 89,5 1203 2390 5546 0,07119 43,1 34,8 8,3 0,59 42,6 0,5 0,0356
2K 1853,8 1951,2 97,4 1099 2527 6218 0,07982 40,6 32,7 8 0,64 41,1 -0,5 -0,0400
1K 1964,4 2065,7 101,3 986 3059 7738 0,09933 39,5 31,2 8,4 0,83 39,7 -0,2 -0,0199
1D 2077,1 2172,4 95,3 877 2728 7269 0,09331 37,5 31,1 6,4 0,60 39,1 -1,6 -0,1493
2D 2182,5 2279 96,5 771 2156 6236 0,08005 34,6 29,8 4,7 0,38 37,5 -2,9 -0,2321
3D 2288,6 2380,5 91,9 667 2025 5840 0,07496 34,7 29,8 4,9 0,37 36,2 -1,5 -0,1124
4D 2384,2 2476,9 92,7 571 1457 4746 0,06092 30,7 28,7 2 0,12 33,8 -3,1 -0,1889
5D 2495,2 2590,8 95,6 459 905 3256 0,04180 27,8 26,7 1,1 0,05 29,2 -1,4 -0,0585
6D 2598,7 2728,6 129,9 343 102 687 0,00882 14,8 18,5 -3,6 -0,03 12,1 2,7 0,0238
30924 77904 Средний сдвиг 6,53% (ЕГФ) -0,67% (РФГ)
[/code]
В таблице опущены ранги от 15 кю и ниже ввиду больших отклонений в этой части шкалы из-за влияния нижней границы рейтинга, где ранг 20 кю присваивается в ЕГФ всем новичкам независимо от реального уровня игры. Как видим, линейно-гиперболическая формула на порядок точнее принятой в ЕГФ логистической кривой. Подробные данные по использованной здесь статистике партий ЕГФ предоставлены в октябре 2006 года Европейским рейтинг-комитетом.





[b]3. Сводная статистика по турнирам до 2008 года[/b]

Всего c 08.01.2005 по 23.12.2007 проведено в России 164 турнира, в которых сыграно 8354 партии. В статистике приводятся частоты побед более старшего (более сильного по рейтингу) в парах игроков. В форовых играх автоматически более старшим считается дающий фору. Как видно из колонок частот и прогнозов для форовых партий, разница между итоговыми числами по всем турнирам (0.25%) значительно ниже уровня допустимой статистической погрешности (стандартное отклонение биномиального распределения составляет для этой выборки 1.7%). Для сравнения: прогноз для шкалы без коррекции дал 564 ожидаемые победы, т.е. отклонение от прогноза составило недобор в 43 победы из 888 партий или около 5%, что превышает стандартное отклонение примерно в три раза. Достаточно значительное отклонение (примерно 1%) в равных партиях комментируется далее при рассмотрении неравномерности отклонений по шкале, хотя этот уровень отклонения не превышает допустимую статистическую погрешность.

[b]Таблица 2.[/b]
[i]Сводная статистика по всем турнирам до 2008 года[/i]

Последние колонки относятся к статистике партий игроков с ЭО и внешних:
ЭО – число участников с экспертными оценками
ЭО+ – число подтвержденных ЭО
Вн – число внешних участников
И_Э – игр с участием ЭО
И_В – игр с участием внешних

[code]

N_tur Всего: Фор-ых Уч_рав N_wins _P_win Уч_фор N_wins _P_win Уч-ков ЭО ЭО+ Вн И_Э И_В
1 050108_StP_For_Chr 26 24 2 1 1,06 24 11 12,02 12 0 0 0 0 0
2 050109_R12_Izh 112 0 82 62 50,08 0 0 0 38 9 3 0 30 0
3 050213_Nov_For_Ch2 25 24 1 0 0,65 17 9 9,39 10 4 2 0 7 0
4 050227_Izh_Sam 19 0 9 5 5,46 0 0 0 8 6 3 0 10 0
5 050227_Tat_Kaz_Cu1 102 0 75 57 58,76 0 0 0 34 9 4 0 27 0
6 050313_Izh_Ch2 47 0 28 20 15,74 0 0 0 21 12 6 0 19 0
7 050313_Mos_ChF 30 0 30 20 21,57 0 0 0 10 0 0 0 0 0
8 050320_Izh_Ch1 43 0 43 35 32,71 0 0 0 18 0 0 0 0 0
9 050320_StP_JAC 138 0 111 74 79,76 0 0 0 48 13 8 0 27 0
10 050327_Izh_ChF 5 0 5 3 3,25 0 0 0 4 0 0 0 0 0
11 050327_Mos_C18 68 0 50 42 35,99 0 0 0 28 8 3 0 18 0
12 050403_Kaz_S12 143 0 143 109 83,69 0 0 0 48 1 1 0 0 0
13 050403_Kaz_S18 78 0 78 61 60,5 0 0 0 27 0 0 0 0 0
14 050417_Izh_Ust_C12 36 0 36 23 20,13 0 0 0 16 0 0 0 0 0
15 050417_Tat_Kaz_C12 15 0 15 13 12,2 0 0 0 6 0 0 0 0 0
16 050421_Tat_Kaz_C18 28 0 28 23 24,45 0 0 0 8 0 0 0 0 0
17 050424_Izh_Stu 25 0 25 20 16,45 0 0 0 10 0 0 0 0 0
18 050424_NNo_OKR 95 0 95 64 68,82 0 0 0 39 0 0 0 0 0
19 050424_StP_Cu2 25 0 25 19 17,89 0 0 0 11 0 0 0 0 0
20 050502_Kem_CKu 41 31 1 0 0,59 19 12 11,62 17 13 6 0 21 0
21 050502_StP_ChF 28 0 28 17 19,81 0 0 0 8 0 0 0 0 0
22 050504_StP_Cu1 30 0 30 26 25,84 0 0 0 13 0 0 0 0 0
23 050509_Chl_Cup 138 0 111 85 79,46 0 0 0 47 11 5 0 27 0
24 050510_Nov_ChF 12 0 12 9 8,34 0 0 0 4 0 0 0 0 0
25 050525_Mos_For 29 27 2 0 1,24 27 9 16 20 0 0 0 0 0
26 050529_Kaz_MAV 105 11 89 54 59,58 11 6 5,7 42 3 2 0 5 0
27 050529_StP_For_Vic 30 11 19 16 15,51 11 9 6,81 11 0 0 0 0 0
28 050612_Bar_CAl 35 33 2 0 1 33 20 22,71 11 0 0 0 0 0
29 050626_Nov_Sib_Hok 40 29 11 8 7,92 29 19 17,62 12 0 0 0 0 0
30 050626_Vla_Fmatch 36 36 0 0 0 0 0 0 12 1 0 6 36 36
31 050630_Mos_Kon 166 0 141 85 91,75 0 0 0 68 4 1 3 25 15
32 050706_Rus_StP_For 211 157 47 22 24,5 140 65 70 81 9 7 3 24 17
33 050710_R16_StP 117 0 111 84 75,89 0 0 0 40 0 0 1 6 6
34 050825_Kha 95 87 1 1 0,68 59 40 32,97 32 16 9 0 35 0
35 050904_Pet_CuK 35 0 35 31 31,4 0 0 0 14 0 0 0 0 0
36 050918_Eka_ChO 25 0 25 23 20,59 0 0 0 10 0 0 0 0 0
37 050925_Mos_Youth 54 0 21 16 13,4 0 0 0 18 9 2 0 33 0
38 050925_Rus_Mos_CAC 142 0 119 83 77,32 0 0 0 58 1 0 4 23 20
39 051009_Izh_ChF_Opn 25 0 20 19 15,42 0 0 0 10 2 1 0 5 0
40 051009_Rus_Izh_Std 96 0 96 75 69,21 0 0 0 32 0 0 0 0 0
41 051016_Vla 52 49 0 0 0 33 21 18,22 22 3 0 2 19 9
42 051020_StP_Ch1_SF1 28 0 19 16 14,45 0 0 0 12 3 1 0 9 0
43 051023_Mos_JAC_Yth 25 0 16 11 10,71 0 0 0 10 3 0 0 9 0
44 051023_Rus_Mos_JAC 111 0 111 79 76,43 0 0 0 47 4 4 0 0 0
45 051030_StP_Ch1_SF2 33 0 30 26 24,46 0 0 0 14 2 1 0 3 0
46 051106_Nov_For_Opn 42 37 3 2 1,9 18 8 10,24 29 9 5 8 21 14
47 051106_R18_Kaz 112 0 112 90 78,69 0 0 0 33 0 0 0 0 0
48 051127_Per_ChO 109 0 104 61 64,34 0 0 0 45 2 1 0 5 0
49 051212_Tat_Kaz_SF2 15 0 15 14 11,78 0 0 0 6 0 0 0 0 0
50 051212_Tat_Kaz_SF1 15 0 15 11 11,13 0 0 0 6 0 0 0 0 0
51 051212_Tat_Kaz_Ch1 15 1 1 1 0,66 0 0 0 6 6 2 0 14 0
52 051212_Tat_Kaz_ChF 15 0 15 11 10,86 0 0 0 6 0 0 0 0 0
53 051218_Kem_ChF 11 0 11 10 8,15 0 0 0 6 0 0 0 0 0
54 051224_RCF_StP 5 0 5 2 3,67 0 0 0 4 0 0 0 0 0
55 051224_RCM_StP 44 0 44 37 34,31 0 0 0 10 0 0 0 0 0
56 051225_Izh_For 25 23 2 0 1,34 23 14 13,06 10 1 1 0 0 0
57 051225_Izh_For_Yth 15 14 1 0 0,52 14 10 7,3 6 0 0 0 0 0
58 051231_NNo_ChF 35 0 25 16 18,39 0 0 0 14 3 1 0 10 0
59 060108_Chl_Opn 58 0 53 45 39,72 0 0 0 20 3 2 0 5 0
60 060108_R12_Chl 78 0 68 51 46,57 0 0 0 27 7 5 0 10 0
61 060122_Mos_SF1 10 0 10 10 8,97 0 0 0 5 0 0 0 0 0
62 060129_StP_LiBo 78 0 75 51 58,72 0 0 0 28 3 2 0 3 0
63 060205_Mos_Kido 53 40 12 7 8,02 31 10 17,34 21 2 0 0 10 0
64 060222_Mos_Qua 9 5 4 1 2,17 5 3 2,82 12 0 0 0 0 0
65 060223_RDo_TCh 16 0 6 2 5,06 0 0 0 16 7 1 0 10 0
66 060225_Chl 54 0 50 34 33,44 0 0 0 22 1 0 0 4 0
67 060225_Tat_Cup 70 14 55 44 40,76 12 9 7,43 29 1 0 0 3 0
68 060326_RDo_Ch 75 0 46 32 30,97 0 0 0 31 16 8 0 29 0
69 060326_StP_JCC 42 0 23 20 18,67 0 0 0 18 0 0 4 19 19
70 060331_StP_Ch 28 0 28 21 21,67 0 0 0 8 0 0 0 0 0
71 060409_Kaz_T12 15 12 2 1 1,45 4 2 2,61 6 2 0 0 9 0
72 060413_Kaz_T18 25 1 24 19 19,63 1 1 1 8 0 0 0 0 0
73 060423_NNo_OC 90 0 90 73 68,93 0 0 0 30 0 0 0 0 0
74 060423_StP_C2L 27 19 5 5 2,99 14 6 8,42 14 6 4 0 8 0
75 060430_Izh_ChP 54 0 54 38 40,43 0 0 0 23 0 0 0 0 0
76 060430_Mos_Qua 14 10 4 3 2,52 10 8 4,89 12 0 0 0 0 0
77 060430_StP_C1L 24 0 24 22 19,7 0 0 0 11 0 0 0 0 0
78 060509_Chl_OKR 102 0 82 66 57,91 0 0 0 38 10 6 0 20 0
79 060510_Izh_Fin 5 0 5 4 3,98 0 0 0 4 0 0 0 0 0
80 060528_Kaz_KMV 143 9 121 76 81,4 5 2 3,22 49 1 1 3 17 17
81 060530_Kaz_S12 89 0 74 42 46,09 0 0 0 39 1 0 2 15 10
82 060530_Kaz_S18 30 0 30 28 24,25 0 0 0 13 0 0 0 0 0
83 060707_R25_StP 48 0 48 35 36,88 0 0 0 20 0 0 0 0 0
84 060711_R16_StP 36 0 36 30 28,66 0 0 0 13 0 0 0 0 0
85 060711_ROC_StP 89 0 89 64 68,26 0 0 0 26 0 0 0 0 0
86 060716_RTC_StP 81 0 81 62 65,1 0 0 0 29 0 0 0 0 0
87 060723_Bar_CA2 14 9 5 5 4,01 9 7 5,28 6 0 0 0 0 0
88 060820_Kha_ChA 15 11 4 1 2,34 11 6 7,12 6 0 0 0 0 0
89 060820_Kha_ChB 15 13 2 1 1,01 8 4 4,71 6 2 1 0 5 0
90 060820_Kir 10 10 0 0 0 10 7 6,52 5 1 1 0 0 0
91 060830_Mos_ChS 27 0 23 19 16,36 0 0 0 16 1 0 0 4 0
92 060831_Mos_QT 9 7 2 2 1,29 7 5 3,99 8 0 0 0 0 0
93 060903_Pet_KrC 24 0 24 21 20,61 0 0 0 10 0 0 0 0 0
94 060924_StP_F4-1 27 24 3 1 1,77 18 14 13,41 12 3 1 0 6 0
95 061001_StP_F4-2 34 32 0 0 0 18 14 12,56 14 7 4 1 16 5
96 061015_Mos_JAC_Det 52 0 32 18 18,7 0 0 0 18 10 6 0 20 0
97 061015_Rus_Mos_JAC 164 0 136 79 86,12 0 0 0 69 13 6 1 28 3
98 061022_Izh_OCR_Yth 38 0 18 6 9,13 0 0 0 14 11 6 0 20 0
99 061022_Rus_Izh_CuO 85 0 80 62 57,65 0 0 0 35 2 1 0 5 0
100 061022_StP_F21 33 0 30 21 23,04 0 0 0 14 1 0 0 3 0
101 061022_Vla_JCC 36 26 4 4 2,28 16 11 8,36 20 12 9 3 16 7
102 061025_Mos_Fs1 29 0 25 21 20,7 0 0 0 15 1 0 0 4 0
103 061029_StP_F22 10 0 10 9 7,64 0 0 0 6 0 0 0 0 0
104 061105_R18_Kaz 66 0 60 46 44,87 0 0 0 22 5 4 0 6 0
105 061125_NNo_Ch 40 0 21 20 17,79 0 0 0 16 9 4 0 19 0
106 061126_Kha_ChR 50 47 2 1 1,09 28 15 16,23 20 7 2 0 20 0
107 061126_Per_Ch 70 0 46 34 32,68 0 0 0 29 12 6 0 24 0
108 061210_Kha_CMP 12 12 0 0 0 12 6 7,35 6 0 0 0 0 0
109 061212_Tat 34 0 34 27 25,98 0 0 0 12 0 0 0 0 0
110 061217_Kha_CAM 25 25 0 0 0 25 22 21,97 10 0 0 0 0 0
111 061218_RCF_NNo 21 0 21 19 18,55 0 0 0 7 0 0 0 0 0
112 061220_NNo_TSC 108 0 30 17 16,97 0 0 0 28 28 15 0 78 0
113 061220_RCM_NNo 28 0 28 24 21,51 0 0 0 8 0 0 0 0 0
114 061224_Chl_Ch 47 0 34 17 24,35 0 0 0 21 9 6 0 13 0
115 070107_Bar_Ch 21 13 5 3 4,25 6 3 3,56 8 6 3 0 10 0
116 070107_R12_NNo 72 0 66 49 43,02 0 0 0 24 7 6 0 6 0
117 070107_StP_Ch 38 0 30 20 23,77 0 0 0 16 4 2 0 8 0
118 070113_Mos_BF2 29 0 29 15 19,79 0 0 0 8 0 0 0 0 0
119 070210_StP_C4F 16 0 9 5 6,25 0 0 0 9 5 2 0 7 0
120 070218_StP_CNY 98 0 83 61 59,51 0 0 0 41 7 3 0 15 0
121 070224_Mos_Kido 77 47 20 13 11,7 29 17 16,69 27 8 5 2 28 12
122 070225_RDo_CJU 54 0 50 38 34,55 0 0 0 26 5 4 0 4 0
123 070228_StP_ChF 37 0 37 27 26,68 0 0 0 10 0 0 0 0 0
124 070303_Nov_NGU 34 32 0 0 0 18 7 9,7 19 14 7 0 16 0
125 070318_Mos_C4F 41 0 25 15 16,26 0 0 0 19 8 3 0 16 0
126 070325_Rus_StP_JCC 100 0 78 50 54,03 0 0 0 40 5 1 1 22 5
127 070402_Kaz_P12 28 11 7 4 3,8 3 3 1,62 8 5 2 0 18 0
128 070405_Kaz_P18 15 0 15 13 11,85 0 0 0 6 1 1 0 0 0
129 070414_StP_C2F 20 0 16 13 11,85 0 0 0 10 1 0 0 4 0
130 070415_Izh_ChP 60 0 51 39 36,69 0 0 0 24 3 1 0 9 0
131 070422_NNo_Cup 75 0 60 43 44,78 0 0 0 30 4 1 0 15 0
132 070501_Chl_CUO 105 0 55 35 38,01 0 0 0 42 22 9 0 50 0
133 070501_StP_ChF 36 0 36 27 28,03 0 0 0 12 0 0 0 0 0
134 070504_Kaz_CPO 84 0 75 58 56,73 0 0 0 34 3 1 0 9 0
135 070506_Kaz_Sh3 55 3 40 35 31,89 2 2 1,42 22 6 3 0 13 0
136 070506_Pet_CFO 30 0 18 14 11,98 0 0 0 12 6 3 0 12 0
137 070506_StP_Std 32 0 18 15 14,17 0 0 0 16 13 8 0 14 0
138 070508_Mos_Ch2 31 0 31 23 24,87 0 0 0 15 0 0 0 0 0
139 070520_Nov_CSO 63 0 33 24 26,46 0 0 0 26 11 3 0 30 0
140 070530_Mos_ChF 28 0 28 22 19,89 0 0 0 8 0 0 0 0 0
141 070629_ROC_Mos 100 0 45 39 33,29 0 0 0 42 3 2 13 55 53
142 070630_Izh_ChF 5 0 5 4 3,99 0 0 0 4 0 0 0 0 0
143 070704_RTC_StP 60 0 60 46 48,57 0 0 0 30 0 0 0 0 0
144 070729_Bar_Alt 53 39 9 5 6,75 25 20 16,08 19 12 7 0 19 0
145 070819_R25_Izh 53 0 45 38 31,36 0 0 0 22 7 5 0 8 0
146 070825_Ufa_Ch 25 23 0 0 0 4 3 2,56 12 7 3 3 21 12
147 070826_Kem_Kuz 48 35 12 8 9,02 25 19 17,96 16 4 2 0 11 0
148 070902_Mos_Fes 57 44 9 6 6,01 36 16 19,14 22 4 2 1 12 3
149 070915_Mos_FOL 39 0 16 8 9,99 0 0 0 26 19 10 0 23 0
150 071007_StP_Osn 35 0 30 25 23,64 0 0 0 16 2 0 0 5 0
151 071014_Izh_CuO 142 0 67 47 45,55 0 0 0 58 36 15 0 75 0
152 071014_Mos_C18 45 0 29 21 21,78 0 0 0 19 8 3 0 16 0
153 071021_Mos_JAC_Yth 28 0 15 11 12 0 0 0 13 9 6 0 13 0
154 071021_Rus_Mos_JAC 134 0 119 79 80,62 0 0 0 55 8 5 1 15 2
155 071105_Pet_ChK 15 0 15 12 10,5 0 0 0 6 0 0 0 0 0
156 071106_R18_Chl 122 0 108 80 76,68 0 0 0 42 4 3 3 14 10
157 071111_Nsk_NCh 58 45 10 9 7,37 25 22 18,51 20 9 4 0 23 0
158 071118_Sib_CTSFO 42 0 37 31 26,45 0 0 0 27 2 0 0 5 0
159 071123_RCF_NNo 14 0 14 12 12,46 0 0 0 8 0 0 0 0 0
160 071128_RCM_NNo 84 0 84 65 64,84 0 0 0 24 0 0 0 0 0
161 071202_Mos_TCM 32 0 32 24 23,7 0 0 0 19 0 0 0 0 0
162 071209_Mos_C12 30 0 8 6 4,96 0 0 0 13 13 7 0 22 0
163 071216_RDo 13 0 4 2 2,55 0 0 0 10 8 4 0 9 0
164 071223_Mos_Chr 18 15 3 2 2,3 13 4 7,05 11 1 0 0 2 0
Итого по всем турнирам 8354 1227 5895 4294 4205 888 521 523,18 3313 661 326 65 1571 275[/code]


[b]4. Статистика равных партий[/b]

Если посмотреть на общие цифры по равным партиям, то кажется будто коррекция ухудшила соответствие частот вероятностным прогнозам, но на самом деле это не так. Во-первых, коррекция носила характер сжатия шкалы для большей части игроков, что не могло сильно отразиться на статистике равных игр. Во-вторых, основной вклад в расхождения частот и прогнозов вносят две группы: «Б/р» и «Б-3». Это группы, где в учитываемых парах один из соперников не имеет разряда и вполне мог получить недавно завышенную ЭО при первом входе в РС. Суммарно эти две группы дают 91 победу в разнице частоты и прогноза в общей статистике, что составляет даже несколько большее значение, чем разница в суммарной статистике частот (89). По общепринятым критериям отсеивания недостоверной статистики эти две группы должны быть удалены и не рассматриваться, т.к. относительные разницы для этих групп учета превышают стандартное отклонение биномиального распределения в среднем по двум группам более чем в три раза (в последней колонке приведены отношения разницы к средневероятному отклонению, примерно равному 2/3 от стандартного отклонения). Объединив в одну группу, получим, что разница побед и прогноза составила 90,6, а стандартное отклонение равно 19,6, т.е. более чем в 4 раза отклонение превосходит статистическую ошибку.

[b]Таблица 3.[/b]
[i]Сопоставление частот и вероятностных прогнозов для равных партий[/i]
[code]
Ожидаемое число побед: с корр. без корр.
Группы учета Партий Побед > Nw_ожид Nw_ож_1 R__сред DR_сред DN/E_b
<900 Б/р 1113 703 641,37 641,36 331 199 5,474
Б-3 429 346 317,08 317,08 807 539 4,138
Б-2 121 114 114,89 114,89 1014 968 -0,239
Б + 50 50 50 50 1178 1524 0
900 3р 330 210 189,8 189,8 1135 140 3,295
3-2 411 316 299,58 299,57 1354 379 2,4
3-1 139 127 135,89 135,98 1527 797 -2,234
3 + 65 63 65 65 1605 1067 -0,735
1400 2р 390 223 225,86 225,86 1597 111 -0,429
2-1 384 291 295,46 297,71 1787 328 -0,674
2-К 135 125 133,28 134,03 1878 625 -2,111
2 + 51 49 51 51 1965 820 -0,83
1800 1р 373 220 219,95 222,29 1996 91 0,007
1-К 401 309 299,86 309,69 2124 219 1,353
1-М 219 205 210,44 214,63 2210 402 -1,09
1-Г 29 29 29 29 2258 594 0
2150 КМC 295 169 170,71 173,68 2246 59 -0,296
К-М 436 343 343,71 358,08 2337 192 -0,1
К-Г 105 96 104,11 104,75 2412 359 -2,345
2350 МС 162 99 98,75 100,97 2445 60 0,058
М-Г 186 156 159,26 164,13 2538 176 -0,708
2550 Гр 71 51 50,03 50,96 2645 71 0,343
Всего: 5895 4294 4205 4250,46 1517 295 3,435
[/code]
Удалив из статистики «плохие группы», получим в 4353 партиях 3245 побед при ожидаемых в скорректированной шкале 3246,6, т.е. разница всего 1/20 от стандартного отклонения. Какое еще лучше может быть совпадение частоты и прогноза? В то же время без коррекции шкалы получается прогноз 3292 и расхождение с частотой составляет 47 побед (около 1,5 стандартных отклонений).

В чем причина возникновения аномалии в самом низу шкалы? Во-первых, уже отмечалось, что неточная формула вероятностей РС-90 приводила к относительному завышению рейтингов самых слабых участников РС. Во-вторых, шкала рейтингов снизу не ограничена, но практика такова, что ниже 20-го кю как правило стартовые рейтинги не присваивались. Это приводило к тому, что ряд игроков входили в РС с завышенными рангами и впоследствии они оказывались в новой шкале как раз в районе границы «3р» (900 в новой шкале, 375 в старой) или немного ниже (но не ниже 600 по новой шкале).