2062: время машин. Тоби Уолш
Чтение книги онлайн.

Читать онлайн книгу 2062: время машин - Тоби Уолш страница 8

СКАЧАТЬ дают профессиональные советы начинающим игрокам. Они также открыли нам новые ходы, о наличии которых мы, быть может, никогда бы и не догадались. Так что их господство в шахматах пошло на пользу самой игре.

      Запуск всех систем

      Март 2016 года – еще одна важная точка в истории ИИ. Именно тогда программа AlphaGo от компании DeepMind победила Ли Седоля, одного из лучших игроков в го на планете. Го – древняя и очень сложная китайская настольная игра, в которой нужно помещать черные или белые камешки на доску размером 19×19 так, чтобы захватить большую часть территории.

      Го – гораздо более сложный случай, чем шахматы, по нескольким причинам. В шахматах существует двадцать возможных ходов в каждом отдельно взятом случае. В го таких ходов может быть около двухсот[20]. В шахматах часто не так сложно определить, кто побеждает: за каждую фигуру на столе можно начислить определенное количество очков, и игрок с наибольшим количеством очков, вероятно, лидирует. В го же все фигурки одинаковы. Для того, чтобы определить, кто побеждает, нужно внимательно следить за тем, какую территорию занимает каждый из участников. Человеку требуются годы практики, чтобы научиться хорошо играть в го.

      В мае 2017 года DeepMind убедительно доказала, что победа над Седолем в 2016-м не была одержана AlphaGo случайно. В матче на 1,8 миллиона долларов[21] улучшенная версия программы победила китайскую легенду го Кэ Цзе, который впоследствии был назван лучшим игроком в мире.

      Однако, несмотря на то что эти две победы значат очень много для развития ИИ, не стоит переоценивать их значимость. AlphaGo была специально разработана для игры в го. Потребовалось бы очень много усилий, чтобы приспособить ее для других игр, таких как, например, покер[22]. Трудно представить, что те же техники, которые работают в AlphaZero (новейшая версия AlphaGo работает исключительно на основе знания правил игры), будут работать и в азартных играх. Разумеется, AlphaZero не способна водить машину, написать роман или перевести юридический документ.

      Другое заблуждение может заключаться в том, что результат, которого достигла AlphaGo, появился ниоткуда, а потому указывает на некий «экспоненциальный» рост в сфере ИИ. На самом деле это не так. Это, несомненно, важное достижение DeepMind, привлекшее к себе столько внимания, заслуживает всяческих похвал. Однако, несмотря на то что AlphaGo предлагает некий новый способ соединения компонентов, сами компоненты остаются практически неизменными[23].

      До появления AlphaGo самой успешной компьютерной программой была CrazyStone, написанная Реми Куломом[24]. В 2014 году Кулом сказал в интервью, что первая победа программы над профессиональным игроком состоится через десять лет. Однако AlphaGo потребовалось немногим больше года, чтобы победить Фэна Хуи, трехкратного чемпиона Европы, и еще один, чтобы победить Ли Седоля.

      Так или иначе, DeepMind приложили больше всех усилий к решению этой задачи. Раньше программы для игры в го писались одним человеком; над СКАЧАТЬ



<p>20</p>

В го первый ход того, кто играет белыми, подразумевает триста шестьдесят один возможный вариант (размеры доски – 19×19). Тот, кто играет черными, может сделать триста шестьдесят разных ходов. Затем, когда игрок белыми делает второй ход, возможных вариантов остается уже триста пятьдесят девять и т. д.

<p>21</p>

Все суммы в долларах (за исключением тех мест, где это специально оговорено) приводятся в валюте США.

<p>22</p>

В октябре 2017 года DeepMind представили AlphaGo Zero. Это улучшенная версия AlphaGo, которую не учили играть в го вручную и не показывали игры лучших спортсменов. Ей были даны только правила игры. То есть ее познания не основывались на тысячах лет человеческого опыта в этой игре, а складывались из того, что она освоила самостоятельно. После трех дней практики программа уже играла на сверхчеловеческом уровне. Как и многие мои коллеги, я был впечатлен. Всего три дня требуется компьютеру, чтобы оказаться там, куда человечество шло тысячелетиями. Еще больше я был впечатлен, когда в декабре 2017-го компания представила AlphaZero, еще более универсальную версию, которая также смогла научиться играть в шахматы и сёги (японские шахматы) на сверхчеловеческом уровне только на основе знания правил. Однако есть определенные сомнения (по моему мнению, существенные) в том, что программа может научиться играть во что-то совсем другое. Шахматы, го и сёги – настольные игры для двух человек. Покер же, например, подразумевает не только большее число игроков, но и много новых факторов, таких как неопределенность и человеческая психология. Для того чтобы выиграть в покер, необходимо иметь дело с неполной информацией о картах соперников, тогда как в го все сведения о том, что происходит в игре, доступны обоим участникам. Кроме того, в покере приходится сталкиваться с психологическими трюками соперника, например блефом. Ни AlphaGo, ни AlphaZero не приспособлены для решения подобных задач. Чтобы доказать универсальность программы, DeepMind должны будут продемонстрировать ей способность побеждать в совершенно разных играх, таких как шахматы, покер или StarCraft. И даже тогда алгоритм AlphaZero будет ограничен только играми.

<p>23</p>

AlphaGo не была первой искусственной нейросетью, которая научилась играть во что-то на нашем уровне. TD-Gammon – программа для игры в нарды – была разработана в 1992 году в научно-исследовательском центре Томаса Дж. Уотсона в IBM. Она показывала уровень чуть ниже, чем у лучших игроков в нарды того времени. Программа использовала стратегии, которые людям и не приходили в голову, и помогла взглянуть на нарды с новой стороны. Так же, как и AlphaGo Zero, она знала только правила игры и научилась всему благодаря постоянной практике.

<p>24</p>

Реми Кулом – талантливый французский программист.