Название: 2062: время машин
Автор: Тоби Уолш
Издательство: Издательство АСТ
Жанр: Техническая литература
Серия: Технологии и бизнес
isbn: 978-5-17-112828-9
isbn:
20
В го первый ход того, кто играет белыми, подразумевает триста шестьдесят один возможный вариант (размеры доски – 19×19). Тот, кто играет черными, может сделать триста шестьдесят разных ходов. Затем, когда игрок белыми делает второй ход, возможных вариантов остается уже триста пятьдесят девять и т. д.
21
Все суммы в долларах (за исключением тех мест, где это специально оговорено) приводятся в валюте США.
22
В октябре 2017 года DeepMind представили AlphaGo Zero. Это улучшенная версия AlphaGo, которую не учили играть в го вручную и не показывали игры лучших спортсменов. Ей были даны только правила игры. То есть ее познания не основывались на тысячах лет человеческого опыта в этой игре, а складывались из того, что она освоила самостоятельно. После трех дней практики программа уже играла на сверхчеловеческом уровне. Как и многие мои коллеги, я был впечатлен. Всего три дня требуется компьютеру, чтобы оказаться там, куда человечество шло тысячелетиями. Еще больше я был впечатлен, когда в декабре 2017-го компания представила AlphaZero, еще более универсальную версию, которая также смогла научиться играть в шахматы и сёги (японские шахматы) на сверхчеловеческом уровне только на основе знания правил. Однако есть определенные сомнения (по моему мнению, существенные) в том, что программа может научиться играть во что-то совсем другое. Шахматы, го и сёги – настольные игры для двух человек. Покер же, например, подразумевает не только большее число игроков, но и много новых факторов, таких как неопределенность и человеческая психология. Для того чтобы выиграть в покер, необходимо иметь дело с неполной информацией о картах соперников, тогда как в го все сведения о том, что происходит в игре, доступны обоим участникам. Кроме того, в покере приходится сталкиваться с психологическими трюками соперника, например блефом. Ни AlphaGo, ни AlphaZero не приспособлены для решения подобных задач. Чтобы доказать универсальность программы, DeepMind должны будут продемонстрировать ей способность побеждать в совершенно разных играх, таких как шахматы, покер или StarCraft. И даже тогда алгоритм AlphaZero будет ограничен только играми.
23
AlphaGo не была первой искусственной нейросетью, которая научилась играть во что-то на нашем уровне. TD-Gammon – программа для игры в нарды – была разработана в 1992 году в научно-исследовательском центре Томаса Дж. Уотсона в IBM. Она показывала уровень чуть ниже, чем у лучших игроков в нарды того времени. Программа использовала стратегии, которые людям и не приходили в голову, и помогла взглянуть на нарды с новой стороны. Так же, как и AlphaGo Zero, она знала только правила игры и научилась всему благодаря постоянной практике.
24
Реми Кулом – талантливый французский программист.
СКАЧАТЬ