Машинное обучение и Искусственный Интеллект. Тимур Машнин
Чтение книги онлайн.

Читать онлайн книгу Машинное обучение и Искусственный Интеллект - Тимур Машнин страница 10

СКАЧАТЬ при вычислении и обработке данных мы переносим данные на компьютер.

      Но если данных очень много, они просто могут не поместиться на одном компьютере.

      Поэтому Google придумал очень просто: они взяли данные и разбили их на куски, и они отправили эти куски файлов на тысячи компьютеров, сначала это были сотни, а потом тысячи, и теперь десятки тысяч компьютеров.

      И они поставили одну и ту же программу на все эти компьютеры в кластере.

      И каждый компьютер запускает эту программу на своем маленьком фрагменте файла и отправляет результаты обратно.

      Затем результаты сортируются и объединяются.

      Первый процесс называется процессом Map, а второй – процессом Reduce.

      Это довольно простые концепции, но оказалось, что вы можете делать с их помощью много разных видов обработки, выполнять много разных задач и обрабатывать очень большие наборы данных.

      И такая архитектура называется Hadoop.

      И когда у нас появились вычислительные возможности для обработки данных, у нас появились новые методы, такие как машинное обучение.

      С помощью которого мы можем взять большие наборы данных, и вместо того, чтобы брать выборку из этих данных и пытаться проверить какую-то гипотезу, мы можем взять большие наборы данных и искать в них шаблоны – закономерности.

      То есть перейти от проверки гипотез к поиску шаблонов, которые, возможно, будут генерировать гипотезы.

      Это отличается от традиционной статистики, где у вас должна быть гипотеза, которая не зависит от данных, и затем вы проверяете ее на данных.

      В машинном обучении сами данные генерируют гипотезы.

      С появлением больших данных и вычислительных возможностей стало актуальным глубокое машинное обучение и использование нейронных сетей.

      Jupyter Notebook

      Технология нейронных сетей существовала 30 лет назад, но ее развитие сдерживалось нехваткой данных и вычислительных возможностей.

      Нейронные сети – это попытка подражать нейронам мозга и тому, как на самом деле функционирует наш мозг.

      Нейронная сеть получает некоторые входные данные, которые затем передаются в разные узлы обработки, которые выполняют некоторые преобразования в данных, а затем передают результаты на другой уровень узлов и, наконец, сеть выдает конечный результат.

      Таким образом, нейронная сеть представляет собой компьютерную программу, которая имитирует, как наш мозг использует нейроны.

      Нейронная сеть содержит входы и выходы, и вы продолжаете вводить данные в эти входы, и смотрите на выходы, и вы продолжаете делать это снова и снова, таким образом, чтобы эта сеть давала нужные результаты, при этом регулируя преобразования внутри сети.

      Так вы обучаете нейронную сеть.

      И теперь у нас есть нейронные сети и глубокое обучение, которые могут распознавать речь и распознавать людей.

СКАЧАТЬ