Название: Сигнал и шум. Почему одни прогнозы сбываются, а другие – нет
Автор: Нейт Сильвер
Жанр: Публицистика: прочее
isbn: 978-5-389-09938-8
isbn:
• вера политиков в способность экономики быстро восстановиться после финансового кризиса могла быть связана с их опытом недавних рецессий, большинство из которых заканчивалось быстрым «V-образным» восстановлением. Однако эти рецессии прежде не были вызваны финансовыми кризисами, а природа этих кризисов достаточно уникальна.
Для описания проблемы подобного типа существует специальный технический термин. В случае значительных ошибок в прогнозировании специалисты обычно говорят о том, что «данные находятся за пределами выборки». И обычно следы именно этой проблемы можно найти на местах подобных «преступлений».
Что означает этот термин? Объяснить его суть нам поможет простой пример.
За пределами выборки – за пределами мышления, или Формула неудачного предсказания
Представьте себе, что вы – очень хороший водитель. Так о себе думают почти все водители{145}, но вы можете это доказать – за 30 лет водительского стажа (то есть совершив 20 тыс. поездок) вы пару раз легко наехали на бордюры.
Помимо этого, вы не злоупотребляете алкоголем и уж точно никогда не садитесь за руль пьяным. Однако как-то раз вы расслабляетесь на рождественской вечеринке в офисе. Не так давно умер ваш хороший друг, и вы находитесь в состоянии стресса. Один коктейль водка-тоник превращается в 12. Вы сильно пьяны. Что лучше сделать – поехать домой, сев за руль, или же вызвать такси?
Ответ кажется очевидным – взять такси. И отменить утреннюю встречу.
Рис. 1.6. Аккуратность и точность
Однако вы начинаете руководствоваться иной логикой. Прежде вы уже совершили 20 тыс. поездок, и лишь в двух из них произошли незначительные инциденты. Иными словами, вы спокойно добрались до места назначения в 19 998 случаях. Кажется, что все свидетельствует о том, что вы способны благополучно доехать до дома. А если у вас есть столь убедительные шансы на успех, зачем напрягать себя вызовом такси?
Разумеется, проблема состоит в том, что ни в одной из этих 20 тыс. поездок вы не находились в состоянии столь сильного опьянения. Размер вашей выборки для оценки успеха при вождении в нетрезвом состоянии равен не 20 тыс., а 0, и вы не сможете использовать свой прежний опыт для предсказания риска аварии в будущем. Это – типичный пример проблемы, связанной с ошибкой выборки.
Хотя может показаться, что избежать подобной ошибки легко, рейтинговые агентства ее допустили. Проделанный Moody’s расчет корреляции между различными ипотечными СКАЧАТЬ
145
«93 % of Drivers Consider Themselves Above Average. Are You Above Average?» Cheap Car Insurance, Aug. 24, 2011. http://www.cheapcarinsurance.net/above-avarege-driver/.