Искусственный интеллект: начала многомерного строчного множества. Сингулярность неизбежна. Сергей Владимирович Соболенко
Чтение книги онлайн.

Читать онлайн книгу Искусственный интеллект: начала многомерного строчного множества. Сингулярность неизбежна - Сергей Владимирович Соболенко страница 8

СКАЧАТЬ имеет по несколько времен и склонений (например, 4), а к тому же по 3 синонима, что тогда мы имеем? 3*4=12 форм существования одного варианта M, N, или O. Так мы получаем неопределенно большое множество:

      M [1..12] +N [1..12] +O [1..12] =D [1..12]

      Грубо говоря, это число будет равным 12^3 или 1728 вариантов. Но допустим, что программист «упоролся» и потратил несколько недель своего времени на то, чтобы описать их все. А если это более сложное выражение? Немного пофантазируем.

      Рис. 13. Пример экспоненциального возрастания вариантов записи выражения, несущего один и тот же смысл, в зависимости от количества использованных слов.

      То есть, чтобы «понять» простым перебором вариантов это предложение размером в 130 байт нам понадобится база данных размером 1 821 639 Терабайт, или 1,8 Петабайт. И даже если на каждую новую запись некий идеальный программист будет тратить всего 1 секунду, это займет у него больше времени, чем существует наша биологический вид – 495 338 914 лет.

      Но даже если гипотетически у нас есть неисчерпаемый ресурс в виде армии из 1 миллиарда программистов и они начнут работу 1 января без перерывов и выходных, то закончат ее примерно к началу лета. А стоимость хранилища составит около $200 млн. И это все будет сделано только для того, чтобы сохранить все варианты только одного, не очень сложного предложения!

      Если же мы (вновь, гипотетически!) реализуем некий алгоритм, который будет пользоваться десятками словарей, генерировать варианты и проверять каждый из них с вычислительной скоростью одного из самых мощных компьютеров мира в 100 петафлопс, на эту работу у него уйдет около 1—2 минут. Соответственно, на обработку страницы текста он затратит порядка 20 минут. Несколько медленно для машины стоимостью в $270 млн., не так ли? (речь идет о китайском суперкомпьютере Sunway TaihuLight имеющем 10,5 миллионов ядер процессоров, – самый мощный компьютер в мире по данным на 2016 год).

      Но как поступает наш мозг и MSM? Они вычисляют классами.

      Та же формула в MSM будет выглядеть как

      A [class A] +B [class B] +C [class C] =D [class D]

      И процесс обучения одному понятию занимает всего 1 запись.

      Например, мы попросим MSM запомнить следующее:

      – Хищное имеет четыре ноги.

      Тогда на частный вопрос:

      – У Льва есть четверка ног?

      Программа ответит «Да». Но заметьте: исходная «учебная» фраза по существу совершенно отлична от второго вопроса. Обучение синонимам так же производилось в модели всего лишь однажды, при формирования классификатора.

      Почему так происходит? В класс «Хищное» уже включены многие понятия и склонения слов, относящиеся к данной ветке. В класс «Лев» включены склонения «Льва», «Льву», «Льве», «Львом», «Львенок», и т. д.

      Остальные понятия также подробно описаны. (Но поиск ведется не парсингом всех возможных вариантов с нахождением точного совпадения, СКАЧАТЬ