Внедрение искусственного интеллекта в бизнес-практику. Преимущества и сложности. Томас Дэвенпорт
Чтение книги онлайн.

Читать онлайн книгу Внедрение искусственного интеллекта в бизнес-практику. Преимущества и сложности - Томас Дэвенпорт страница 7

СКАЧАТЬ весьма широк и охватывает все – от повышения градиента (метода построения моделей, которые устраняют ошибки предыдущих моделей, тем самым повышая их способность к прогнозированию и классификации) до случайных лесов (моделей, которые представляют собой ансамбль моделей дерева принятия решений). Все чаще программное обеспечение (включая DataRobot, SAS и AutoML от Google) позволяет автоматизировать построение моделей машинного обучения, в ходе которого происходит апробация различных алгоритмов с целью выявить наиболее удачный[14]. Как только обнаруживается лучшая модель для прогнозирования или классификации тренировочных данных, ее используют для прогнозирования и классификации новых данных (иногда это называют скорингом).

      Однако важен не только используемый алгоритм, но и принцип обучения создаваемых моделей. Модели обучения с учителем (на сегодняшний день наиболее распространенные в бизнесе) учатся на основе набора тренировочных данных с маркированным результатом. Например, модель машинного обучения, которая пытается предсказать мошенничество в банке, необходимо учить на системе, где мошенничество в некоторых случаях было однозначно установлено. Это непросто, поскольку частота мошенничества может составлять 1 случай на 100 000, и порой эту проблему называют проблемой несбалансированности классов.

      Обучение с учителем очень похоже на традиционный аналитический метод регрессионного анализа, который используется в модели оценки. Цель регрессионного анализа заключается в том, чтобы создать модель, предсказывающую известный результат, используя набор входных переменных с известными значениями, которые могут быть связаны с этим результатом. Когда модель разработана, ее можно использовать для предсказания неизвестного результата на основе известных значений тех же входных переменных. Например, можно разработать регрессионную модель, предсказывающую вероятность заболевания диабетом в зависимости от возраста пациента, уровня его физической активности, количества потребляемых калорий и индекса массы тела. При разработке этой модели мы будем ориентироваться на пациентов, которые уже заболели или не заболели диабетом, используя все доступные данные для построения регрессионной модели. Обнаружив хорошую предсказательную регрессионную модель, мы сможем использовать ее на новом наборе данных, чтобы предсказать неизвестный результат – вероятность заболевания диабетом в зависимости от определенных значений входных переменных. Это называется скорингом (как в регрессионном анализе, так и в машинном обучении).

      Регрессионный процесс напоминает машинное обучение с учителем, но имеет ряд особенностей:

      ● В машинном обучении данные, используемые для разработки (тренировки) модели, называются тренировочными данными и могут представлять собой подмножество данных, необходимых исключительно для тренировки системы.

      ● В машинном обучении тренировочная модель часто утверждается СКАЧАТЬ



<p>14</p>

Mathew Mayo, "The Current State of Automated Machine Learning," KDNuggets blog post, January 25, 2017, https://www.kdnuggets.com/2017/01/current-state-automated-machine-learning.html.