ГоБиблиотека: ТурнирныеСхемы/Фора/Форс/Обоснование

Здесь будет приведена система уравнений, а затем показано, как из нее получается основная схема начисления зачетных очков в системе ФОРС – см. ТурнирныеСхемы/Фора/Форс.

Го (ГоКарта) => Го/Методики => Го/Методики/Турниры = ОрганизацияТурниров (ОрганизацияТурнировКарта) => ОрганизацияТурниров/Системы = ТурнирныеСхемы
Го => Го/Архив => Го/Архив/Турниры = Турниры (ТурнирыКарта) => Турниры/Системы = ТурнирныеСхемы

Оглавление документа

Предварительные замечания

Новая система, как это и было заявлено с самого начала, статистически эквивалентна Мак-Магону при увеличении числа туров в смысле ранжировки по местам, очкам в турнире, при этом все партии могут быть форовыми. Полная эквивалентность будет, естественно, если начальные очки присваивать как и в системе ММ – по рейтингу и с шагом 10 очков на разряд, а после этого ограничиться только верхней группой ФОРСа. Подробнее о том, как корректно назначать стартовые очки в системе ФОРС, читайте ниже в соответствующем разделе страницы.

В партии разыгрывается 30 очков (целочисленный вариант), 10 очков каждый получает автоматически, затем еще 10 перераспределяются в зависимости от форы и пр. Халявных очков нет, так как 10 очков – у всех поголовно, что эквивалентно их отсутствию, с точки зрения расстановки по местам. Решение получающихся при математическом обосновании уравнений может давать и отрицательные очки при некоторых достаточно больших разницах в рейтинге, поэтому и добавлен такой сдвиг в 10 очков.

Главное отличие от ММ, кроме форы, заключается в фактической дробности начального присвоения очков, что частично устраняет неравенство стартовых условий для близких по рейтингу игроков. В обычном ММ часто два рядом стоящие по рейтигу имеют на старте разницу в одно очко.

При выводе основных формул компенсации в очках за фору возможны два подхода:

  • В ПЕРВОЙ схеме исходное предположение при выводе системы уравнений:
    • ожидаемое число очков в каждой партии на форе между РАВНЫМИ ПО СИЛЕ соперниками равно ожидаемому числу очков при игре таких же соперников без форы.

  • Во ВТОРОЙ схеме:
    • ожидаемое число очков в каждой партии на форе, строго соответствующей разнице рейтингов, такое же, как при игре ТЕХ ЖЕ САМЫХ соперников на равных, то есть без форы.

Естественно, рассматриваются ожидаемые очки до преобразования результата партии из 1:0 в 20:10.

Первая схема эквивалентна ММ только условно – при достаточно ровном составе участников. Вторая эквивалентна ММ статистически строго: при увеличении числа туров конечный результат в смысле ожидаемого числа очков (математическое ожидание, т.е. не целая, вообще говоря, величина!) будет все более близким (абсолютного совпадения, естественно, не будет в силу вероятностного характера всех параметров и различия целых и дробных очков). Именно последний вариант и содержит коэффициент К, зависящий от рейтинга партнеров. Он введен для полной математической строгости. На практике конечно можно и усреднить, особенно при достаточно ровном составе.

Вторая система уравнений при обсуждении на форуме в 2003 году не приводилась, а был дан только конечный результат в виде условного выражения от К. Замечу, что нет смысла анализировать систему для турниров с сильно разнородным составом, как это мы наблюдали в одном из турниров на КГС.


Основная система уравнений

При задании условия второго типа получается система уравнений, где есть один свободный параметр. При выборе конкретного значения этого параметра я стремился к тому, чтобы очки за отдельную партию не вылезали за рамки положительных чисел, не превосходящих 30 очков. Вот упоминавшаяся система (до перехода к 30 очкам, т.е. для счета очков 1:0):

а1в *0.5 + а1п* 0.5 = р = 0.5 + DR/(3000 – Rср);

а1в + а2п = 1;

а1п + а2в = 1.

Здесь р – вероятность победы дающего фору при игре с данным соперником на равных.

Четвертое уравнение линейно зависимо от остальных и поэтому не приводится. Выразим все параметры через один, например а2п:

а1п = 2р – 1 + а2п;

а1в = 1 – а2п;

а2в = 2(1 – р) – а2п.

Пусть к = 2р – 1 = 2*DR/(3000 – Rср); учтем, что

0.5 <= р <= 1, т.е. к <= 1.

Считая свободным параметром а2п, можно искать такие его значения, может быть зависящие от р, которые дают самые простые формулы.


Переход к системе зачетных очков

После перехода к 30 очкам, разыгрываемым в отдельной партии, к заменится на К = 10к <=10. Один из возможных вариантов решения приведенной выше системы уравнений для выбора конкретного распределения очков – это положить а2п = – к = 1 – 2р, тогда для остальных параметров получим

а1в = 1 + к, а1п = 0, а2в = 1.

Или после естественного перехода к 30-ти-очковому исчислению:

а1в = 20 + К; а1п = 10; а2в = 20; а2п = 10 – К,

что и есть внешне основная схема разделения очков в турнире по системе ФОРС. Только на К накладываются некоторые ограничения, так как этот параметр связан с р:

К = 20р – 10,

где р – вероятность победы более сильного (дающего фору) в партии тех же соперников при игре на равных. Таким образом, система ФОРС с форой, строго соответствующей разнице разрядов, так же «строго» (с оговорками, упомянутыми в начале страницы) аппроксимирует и ММ, если К, т.е. фактически шаг форы, выбирается с учетом последнего уравнения. Например, если средний рейтинг соперников равен 2000, то К = 1 соответствует р = 11/20 = 0.55, откуда из формулы вероятностей находим шаг форы в очках рейтинга s = 0.05*1000 = 50, что в точности соответствует полкамня (коми).

На практике не считают шаг форы для каждой пары, а усредняют значение этого шага для всей группы. Поэтому шаг в полкамня целесообразно назначать для группы, в которой средний рейтинг игроков около 2000, что и рекомендовано в описании системы ФОРС. Однако желающие могут точно рассчитывать и шаг, и фору – с точностью до одного очка коми. Это можно только приветствовать, если не будет технических сложностей при проведении турнира по такой усложненной схеме.

В заключение следует отметить, что для не очень большой разницы в рейтингах оба подхода к получению уравнений коррекции форы приводят практически к очень близким результатам, но рассмотренный вариант дает самые простые формулы.


О стартовых очках в сиcтемах с группами по рейтингу

В заключение остановимся на вопросе выбора величины шага стартовых очков в зависимости от состава групп по рейтингу. Это вопрос важен, поскольку при наличии у турнира спортивных целей необходимо обеспечить главный критерий спортивности: «более сильный игрок должен иметь больше шансов занять выше место». В описании был приведен только один способ начисления стартовых очков, при котором шаг вверху во второй группе (верхней группе игры с форой) равен 10 очков на один разряд (дан или кю). Давайте выясним, при каких условиях игрок, имеющий заниженный рейтинг (а это может быть не его вина) оказывается в равных условиях с игроком той же реальной силы игры – в смысле возможностей занять примерно такое же итоговое место.

Пусть N – число туров, Р1 и Р2 – средние рейтинги двух соседних групп ММ (или двух рейтинговых окрестностей с шагом в один разряд в СЕРП или ФОРС). Считаем справедливой формулу вероятностей из нового проекта РС:

р = 0.5 + (Р1 – Р2)/Dср, Dср = [(3000 – Р1)(3000 – Р2)]1/2,

и пусть S – шаг стартовых очков. Предположим, что во второй группе ММ находится игрок, с реальной силой, соответствующей первой группе (т.е. его рейтинг на один разряд занижен). При каких условиях игроки первой группы будут иметь точно равные в среднестатистическом смысле условия по конечным очкам? Если сила игрока точно соответствует рейтинг-уровню группы, то он набирает в среднем 50% очков, оставаясь в своей стартовой группе и выходя из нее только в силу дисперсии Бернулли, которую мы не можем «уничтожить» и с этим приходится мириться во всех системах. Примерно поровну из числа игроков рассматриваемой группы выйдут вверх и вниз, но среднестатистический игрок может считаться сохраняющим свою группу. Тогда во всех схемах заниженный игрок будет постепенно подниматься по очковым группам, отрываясь от своей стартовой группы, т.к. у него выше вероятность победы на (Р1-Р2)/Dср в среднем в каждой партии. Чтобы он оказался к концу турнира (в среднестатистическом смысле) в первой группе должно выполняться условие:

S = N (Р1 – Р2)/Dср,

для ММ, а в СЕРП/ФОРС при ценности партии в 10 очков еще и на 10 умножить надо соответственно. Причем во всех схемах все будет строго соответствовать этому условию «равномерной справедливости» (СЕРП ~ ФОРС ~ ММ), если в форовых вариантах применяется статическая фора, т.к. тогда в правой части вероятности одни и те же, поскольку фора выставляется по разнице начальных рейтингов. При Р1 = 2050 и Р2 = 1950 легко получается

S = N.

Это условие при N = 5 соответствует пяти очкам шага стартовых очков в верхней форовой группе, если она близка к среднему уровню 1 кю. Данное условие следует рассматривать как самое справедливое, но для организаторов, стремящихся наказывать за заниженный рейтинг, можно пользоваться дополнительным зазором, как обычно и делают в турнирах по системе ММ.

Все выше изложенное справедливо для всех разниц уровней вблизи 1 кю, если максимальное занижение рейтинга не очень велико (не больше пяти), так как формула вероятностей линейна по разнице рейтингов. Еще можно добавить, что в «классической» схеме ФОРС даже с симметризацией очков дополнительный «зазор» при погоне за лидерами может возникать за счет того, что лидеры первой группы будут сильнее отрываться, чем это будет возможно для догоняющего – победы первым в некоторых партиях дают больше очков бонуса, так как они, вероятно, будут чаще давать фору, чем догоняющий.

С другой стороны, в формуле вероятностей в знаменателе среднее расстояние до 3000 будет несколько уменьшаться, так как игрок будет встречаться от тура к туру со все более высокими по рейтингу (в среднем) игроками, пока не дойдет до своей «истинной по силе игры» группы, что приведет к небольшому росту вероятностей в системе ФОРС и может рассматриваться как незначительная компенсация упомянутого возможного дополнительного отрыва лидеров.

Практика проведения нескольких турниров «в реале» по системе ФОРС, а также двух турниров на пошаговом интернетовском сервере «Го-Дракон» – по системе СЕРП, показала, что шаг в 5 стартовых очков достаточно надежно обеспечивает выполнение критерия спортивности при игре с линейной форой (по разнице рейтингов) и среднем рейтинге верхней группы около 1 кю.


Заключение

Во время обсуждения системы на форуме было множество высказываний, и большинство из них имели в своей основе разумное начало, интуитивную правдоподобную суть. Однако в этих высказываниях не всегда правильно трактовались вероятностные процессы при игре в го-турнирах. В частности, неоднократно заявлялось, что просто необходимо динамически корректировать фору в ходе турнира на основе краткосрочных результатов игроков, а то, мол, иначе вся система ФОРС ошибочна! В одной из веток разбиралось два парадокса вероятностного характера. Один из них – о серии 100% результатов в олимпийской системе, которую показывает победитель независисмо от реального соотношения сил игроков на старте. Вот ответ Алексея Хованца:

Если исходный постулат о равенстве силы игроков верен, то побеждать в турнире будут всегда разные игроки, что при достаточном кол-ве турниров приведет к вполне равномерному распределению результатов.

Еще раз хочу прокомментировать этот, безусловно замечательный и правильный ответ. В теории вероятностей и мат. статистике при вопросах прикладного характера одна из главных проблем – построение вероятностно-статистической модели. В кн. «Теория вероятностей» академик А.А.Боровков отмечает, что этот вопрос бывает весьма сложен даже в очень простых по постановке практических задачах.

Например, какую модель пространства событий выбрать для описания турнира по Го (с форой или без – не суть важно)? Если выбирать классическую модель: столько-то исходов в каждой из партий, каждый имеет вероятность (предположим что известную), то пространство элементарных событий получается одно. Соответственно с ним и придется работать. Можно предположить вероятности неизвестными, и вообще – случайными функциями. Получим другую модель.

Можно взять за элементарное событие реализацию выборки определенной длины (по числу туров) из набора (0,1) «с возвращением». Если задана вероятность появления 1 в однократном опыте, то это – так называемая схема Бернулли. В ней предполагается, что условия опыта не меняются и испытания независимы друг от друга. На этой схеме построены большинство рейтинг-систем. Тогда в описанном парадоксе нарушаются условия применения модели «схема Бернулли». Аналогично «слегка» нарушаются эти условия и в системе МакМагон, а наиболее точно соответствуют схеме Бернулли только турниры с ФОРОЙ, максимально сводящей все вероятности к одному числу – 0.5! Но для этого нужно предполагать по-прежнему неизменность силы игроков в самой схеме Бернулли. Ошибка в начальном задании рейтинга неустранима и всегда будет, у кого-то меньше, а у кого-то – больше, но краткосрочный (на два-три тура) прогноз результатов имеет низкую достоверность даже тогда, когда вероятность строго равна 0.5 – из-за случайного характера самого процесса. Поэтому и поправку к рейтингу предпочитают делать не менее чем по 5-10 результатам (хотя можно и после каждой партии – при свободном и случайном блуждании по множеству партнеров). Этот диапазон отмечен М.Гликманом как оптимальный для пересчета рейтингов по системам типа Эло или Глико на основании результатов специальных статистических экспериментов.

Таким образом оказывается, что коррекция форы на основе разницы побед и поражений, динамически в ходе турнира с заданным числом туров, на самом деле не увеличивает достоверность выявления более сильных игроков, а снижает ее, так как по сравнению с классической схемой Бернулли деформирует распределение конечных результатов очень интересным образом: уменьшаются вероятности крайних результатов, а плотность результатов в середине возрастает. Следовательно, при малой разнице в силе игры у лидеров труднее становится выделить действительно сильнейшего, т.е. – чемпиона.

Не правда ли, интересный факт?

А сама система уравнений со свободным параметром, полученная в ходе обоснования системы ФОРС, позволяет дальнейшее обобщение: можно ведь не предполагать точное соответствие форы и разницы в силе игры (оцениваемой по разнице рейтингов), а учесть этот момент путем введения еще одного свободного параметра. Тогда при применении получаемых точных формул компенсации за фору так модифицированная схема ФОРС по-прежнему будет статистически корректно описывать распределение игроков по силе игры.


Комментарии