Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет. Нейт Сильвер
Чтение книги онлайн.

Читать онлайн книгу Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет - Нейт Сильвер страница 36

СКАЧАТЬ style="font-size:15px;">      1. Принимать во внимание текущий статус статистики игрока.

      2. Разделять навыки и удачу.

      3. Понимать, каким образом изменяется результативность игрока по мере его взросления – эта закономерность известна под названием кривой старения.

      Первая задача сравнительно проста. Бейсбольные соревнования, наиболее уникальные из основных американских видов спорта, всегда проводились на полях с нестандартными размерами. Среднему игроку значительно проще показывать хорошие результаты в уютном квадратном Фенвей-парке (контуры которого заданы компактными улицами Новой Англии), чем на напоминающем пещеру стадионе «Доджер», окруженном огромными парковками. Наблюдая за тем, как ведут себя игроки при игре дома и в гостях, мы можем рассчитать так называемый фактор парка, позволяющий учитывать степень сложности, с которой сталкивается игрок. Например, Фред Линн, основной игрок Red Sox в 1970‑е гг., добивался результата 0,347 во время игр в Фенвей-парке, но его результат на любом другом стадионе был равен лишь 0,264. Аналогичным образом, наблюдая за результатами игроков после перехода из Национальной лиги в Американскую лигу, мы можем довольно четко сказать, какая лига лучше, и оценить силу конкурентной позиции игрока.

      Самый масштабный набор данных в мире

      Решить вторую задачу – то есть разделить навыки и удачу – намного сложнее. Бейсбол выстроен таким образом, что в краткосрочной перспективе удача играет большую роль – даже лучшие команды проигрывают до трети матчей, и даже лучшие подающие не могут добраться до базы каждые три раза из пяти. Иногда удача не позволяет распознать подлинный уровень навыков игрока даже за целый год. Во время любого сезона бьющий, объективный результат которого 0,275, с вероятностью 10 % может добиться результата 0,300 и, соответственно, с той же вероятностью иметь результат 0,250. И это зависит только от одной лишь удачи{197}.

      Хорошо продуманная система прогнозирования может оценить, какие статистические показатели сильнее зависят от удачи. Например, среднее количество попаданий битой по мячу более подвержено влиянию ошибок, чем количество хоумранов. Это особенно важно для питчеров[39], статистика которых невероятно непоследовательна. Если вы хотите предсказать, насколько успешной будет игра питчера, то вам стоит смотреть на количество страйкаутов[40] и уолков[41], а не на данные о его выигрышах и проигрышах в предыдущем сезоне, поскольку первый набор статистических данных выглядит более последовательным от года к году.

      Как и при разработке любого прогноза, цель в данном случае состоит в выявлении основополагающей причины – выбивание в аут не позволяет отбивающим игрокам команды соперника добраться до базы, что, в свою очередь, не дает им получить дополнительные очки, а значит – и выиграть матч. Однако чем глубже вы копаете, тем больше шума окажется в системе: СКАЧАТЬ



<p>197</p>

Этот расчет основан на биномиальном распределении, и предполагается, что игрок получает 500 «выходов к бите».

<p>39</p>

Питчер (pitcher) – игрок защищающейся команды, подающий мяч.

<p>40</p>

Страйк (strike) – ситуация в бейсболе, когда бэттер (бьющий) не нанес удара при подаче. Если бьющий набирает три страйка – это называется страйк-аут (strike-out), – бьющий выбывает из игры.

<p>41</p>

Уолк (walk), он же бейс он болс (Base on balls), – количество раз, когда бэттер набирает четыре бола и проходил на первую базу. Бол (ball) – подача, осуществленная питчером, не попавшая в страйк-зону.