2062: время машин. Тоби Уолш
Чтение книги онлайн.

Читать онлайн книгу 2062: время машин - Тоби Уолш страница 22

СКАЧАТЬ обновляется всякий раз, когда игрок побеждает или проигрывает, а также меняется в зависимости от рейтинга соперника. Полагаться на тот рейтинг Эло, который присваивается компьютерным программам, однако, не всегда стоит, так как они часто играют совсем немного официальных игр. Тем не менее разрыв между ними и нашими лучшими шахматистами так велик, что человек практически не имеет шансов против компьютера.

      20

      В го первый ход того, кто играет белыми, подразумевает триста шестьдесят один возможный вариант (размеры доски – 19×19). Тот, кто играет черными, может сделать триста шестьдесят разных ходов. Затем, когда игрок белыми делает второй ход, возможных вариантов остается уже триста пятьдесят девять и т. д.

      21

      Все суммы в долларах (за исключением тех мест, где это специально оговорено) приводятся в валюте США.

      22

      В октябре 2017 года DeepMind представили AlphaGo Zero. Это улучшенная версия AlphaGo, которую не учили играть в го вручную и не показывали игры лучших спортсменов. Ей были даны только правила игры. То есть ее познания не основывались на тысячах лет человеческого опыта в этой игре, а складывались из того, что она освоила самостоятельно. После трех дней практики программа уже играла на сверхчеловеческом уровне. Как и многие мои коллеги, я был впечатлен. Всего три дня требуется компьютеру, чтобы оказаться там, куда человечество шло тысячелетиями. Еще больше я был впечатлен, когда в декабре 2017-го компания представила AlphaZero, еще более универсальную версию, которая также смогла научиться играть в шахматы и сёги (японские шахматы) на сверхчеловеческом уровне только на основе знания правил. Однако есть определенные сомнения (по моему мнению, существенные) в том, что программа может научиться играть во что-то совсем другое. Шахматы, го и сёги – настольные игры для двух человек. Покер же, например, подразумевает не только большее число игроков, но и много новых факторов, таких как неопределенность и человеческая психология. Для того чтобы выиграть в покер, необходимо иметь дело с неполной информацией о картах соперников, тогда как в го все сведения о том, что происходит в игре, доступны обоим участникам. Кроме того, в покере приходится сталкиваться с психологическими трюками соперника, например блефом. Ни AlphaGo, ни AlphaZero не приспособлены для решения подобных задач. Чтобы доказать универсальность программы, DeepMind должны будут продемонстрировать ей способность побеждать в совершенно разных играх, таких как шахматы, покер или StarCraft. И даже тогда алгоритм AlphaZero будет ограничен только играми.

      23

      AlphaGo не была первой искусственной нейросетью, которая научилась играть во что-то на нашем уровне. TD-Gammon – программа для игры в нарды – была разработана в 1992 году в научно-исследовательском центре Томаса Дж. Уотсона в IBM. Она показывала уровень чуть ниже, чем у лучших игроков в нарды того времени. Программа использовала стратегии, которые людям и не приходили в голову, и помогла взглянуть на нарды с новой стороны. Так же, как и AlphaGo Zero, она знала только правила игры и научилась всему благодаря постоянной практике.

      24

      Реми Кулом – талантливый французский программист.

СКАЧАТЬ