Коварство средней статистики

Закон больших чисел в спорте — враг или друг игрока?

Приветствую всех на страницах моего блога! Сегодня хочу затронуть нестандартную тему: как правильно использовать среднюю статистику? На идею натолкнул завершившийся недавно чемпионат Европы-2020 по футболу, и вот в чём соль.

Евро-2020 стал предметом всеобщей истерии по поводу среднего количества голов: 2,79 мяча за игру, лучший результат в истории чемпионатов Европы. Восхищению нет предела. Однако, на самом деле, средняя статистика нагло обманывает: из 51 матча на турнире проходом ставки на ТБ 2,5 завершились лишь 24 игры — всего 47%.

Средняя статистика без правильного анализа токсична для ваших ставок. Но и полностью игнорировать эти данные не стоит. Почему? Разбираемся вместе.

Закон больших чисел

Закон больших чисел — один из фундаментов теории вероятности, который, в свою очередь, активно используется при составлении линии на спортивные события. Интересно, что впервые закон сформулировал в XVI веке Джероламо Кардано в книге «Об азартных играх». Математик был большим любителем поиграть в кости, что и выразилось в его работе.

Итак, закон больших чисел гласит: среднее значение случайных величин из заданного распределения близко к теоретическому среднему значению этого распределения.

То есть, если средний тотал голов условного «Милана» составляет 1,95 за игру, то при бесконечном количестве матчей количество забитых мячей миланцев будет крутиться вокруг этого значения.

Закон активно используется в стратегии ставок «догон», хотя многие даже не осознают этого. Всё просто: если есть тренд, который прервался без видимых причин, то он снова сыграет в следующей итерации.

В теории вероятности есть понятие «регрессия к среднему» — разновидность поведенческих нестандартных убеждений, согласно которым измерения случайной величины, находящиеся до и после экстремумов, неизменно стремятся к среднему значению всей выборки.

Перевожу на русский: если «Милан» сегодня не забил, то в следующей игре при отсутствии противоречащих факторов забьёт трижды, чтобы прийти к своему среднему значению голов.

У монетки есть память?

Готовясь к материалу, наткнулся в интернете на множество статей (к сожалению, одинаковых), в которых закон больших чисел называют одним из самых больших заблуждений в беттинге. В качестве аргументации приводят классический пример с подбрасыванием монетки: если девять раз подряд выпал орёл, вероятность выпадения 10-го составляет те же 50%. Обоснование — у монетки нет памяти. Но на деле это «заблуждение» само является заблуждением!

У ставок на спорт, в отличие от монеты, есть память. Нельзя игнорировать случай, когда команда сыграла девять матчей подряд на ТМ 2,5 — это сигнал (сигналище ☝) к тому, чтобы придерживаться этого тренда.

Вывод

Закон больших чисел ни в коем случае нельзя недооценивать в ставках на спорт. При анализе спортивных событий невозможно обойтись без средней статистики, это очень важный показатель. Средняя величина погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой. Без неё анализ будет неполным.

НО!

Почему же тогда неверной оказалась выборка по чемпионату Европы-2020? Всё дело в количестве данных для анализа.

Закон малых чисел

Закон малых чисел (да и не закон вовсе, а просто термин) — самый большой враг игрока на ставках. В обиходе появился не так давно, в 1971 году, и никак не связан с законом больших чисел. Относится больше к психологии, чем к математике, и сформулирован как раз психологом Даниэлем Канеманом.

Итак, закон малых чисел — желание увеличить значение малой выборки до общей совокупности.

Мне больше всего понравился следующий эксперимент: назовите 10 слов, начинающихся с буквы «Р», как можно быстрее. Затем 10 слов, в которых буква «Р» стоит в середине. И, наконец, слова, в которых «Р» стоит в конце. Большинство людей легко справляются с первым заданием (слова начинаются с буквы «Р») и намного сложнее — с двумя другими. Но это ведь не означает, что слов на «Р» больше, чем слов с этой же буквой в середине или конце, верно? Такой парадокс назван «эвристикой доступности».

Эвристика доступности — это интуитивный процесс, в котором человек оценивает событие как более частое или более вероятное по степени лёгкости.

И вот тут кроется главный минус средней статистики. Мы видим красивые цифры и не понимаем, что за ними кроется, слепо верим авторам статьи/прогноза, упуская из виду важные детали. Фактически средняя статистика обманывает наш мозг, давая ему поверхностную информацию. Возникает игровая апофения, то есть способность видеть структуру там, где её на самом деле нет. Поразительно, но этим страдают не только новички в ставках (что объяснимо), но и опытные игроки, которые ленятся залезть глубже и разобраться, откуда взялись средние цифры.

Евро-2020 как раз стал идеальным примером: высокая средняя результативность была перепутана с результативностью конкретного матча. Как итог, все, кто ставил на ТБ 2,5 в плей-офф, оказались в глубоком минусе, ведь только в шести из 15 игр было забито больше двух голов.

Вывод

Всегда проверяйте среднюю статистику: сколько данных взято для выборки (точность возрастает с увеличением итераций); что учитывает выборка (например, в статистике Евро-2020 учитывались голы вне основного времени); верно ли выбран период выборки (после смены главного тренера, после травмы, после каких-то других важных психологических, эмоциональных или физических изменений у спортсмена).

Идеальный вариант — если средняя статистика коррелирует с абсолютными показателями. Проверить и сопоставить очень сложно и трудоёмко. Но кто сказал, что ставки на спорт — это просто?

И помните: ставки — это развлечение. Но в любимом хобби нужно стараться быть лучшим!

Читайте также: