Всё об искусственном интеллекте за 60 минут. Питер Дж. Бентли
Чтение книги онлайн.

Читать онлайн книгу Всё об искусственном интеллекте за 60 минут - Питер Дж. Бентли страница 9

СКАЧАТЬ В то время как ИИ, такие как Cyc и Evi, полагались на тысячи пользователей, предоставлявших сведения вручную, сэр Тим Бернерс-Ли, создатель Всемирной паутины, давно высказал идею, что WWW (World Wide Web) должна стать GGG (Giant Global Graph) – гигантским глобальным графом[6] данных. То есть помимо того, что веб-сайты стоит делать удобными для пользователей, на них также необходимо хранить данные в форме, понятной компьютерам. Сайты традиционно создавались как документы с текстом, изображениями и видео или как программы со сценариями, которые запускаются при заполнении форм и нажатии кнопок. В мечтах же Бернерса-Ли внутри каждой веб-страницы данные поименованы и имеют уникальные идентификаторы. В семантической паутине веб-сайты становятся базами данных сведений, где каждый элемент является самостоятельным объектом, который может быть найден независимо и имеет четкую текстовую метку или тип. Если вся WWW станет GGG, то наши ИИ смогут искать знания всего мира, рассуждать о них и делать выводы.

      Эта великая мечта о символическом ИИ, к сожалению, не была принята большинством веб-разработчиков – они продолжают размещать огромные объемы данных в интернете в форме, которую ИИ с трудом распознает. Но такая необходимость становится насущной. Было подсчитано, что в 2019 году 80 % новых данных оказались неструктурированными, то есть не были представлены в такой форме, которую могут понять компьютеры, – это текстовые документы, изображения и видео. (Подумайте обо всех электронных письмах и отчетах, которые вы пишете в виде «свободного текста», не разбивая его на разделы. Или о фотографиях и видео, что вы снимаете на телефон, – вы не просматриваете и не обозначаете каждую сцену или элемент в кадре.) В то же время объем данных растет с каждым годом. В 2019 году число пользователей интернета составило 4,4 миллиарда, что на 80 % больше чем пятью годами ранее, и ежедневно отправлялось 293 миллиарда электронных писем. Каждую секунду в Google создавалось 40 000 поисковых запросов и публиковалось 7 800 твитов. Все больше и больше компаний использовали интернет в качестве части своего бизнеса и генерировали огромные объемы данных. В 2016 году в день собиралось 44 миллиарда гигабайт данных. Подсчитано, что к 2025 году в день мы будем генерировать 463 миллиарда гигабайт.

      У меня есть мечта…[7] Машины смогут анализировать все данные в сети… сегодняшние механизмы торговли, бюрократии и повседневной жизни будут управляться машинами, разговаривающими с машинами, оставив людям вдохновение и интуицию.

ТИМ БЕРНЕРС-ЛИ (2000)

      У нас больше нет выбора: ни один человек не сможет осмыслить эти ошеломляющие объемы данных. Наша единственная надежда – использовать ИИ в качестве помощника. К счастью, об этом речь пойдет в следующих главах, другие формы ИИ теперь способны обрабатывать неструктурированные и немаркированные данные и помечать их особыми метками, давая символическим ИИ то, что им необходимо, чтобы оперировать такими данными. В конце концов, пожалуй, не имеет значения, СКАЧАТЬ



<p>6</p>

Граф – структура данных, состоящая из множества вершин и ребер, соединяющих их.

<p>7</p>

Отсылка к наиболее известной речи Мартина Лютера Кинга I have a dream («У меня есть мечта»).