Машинное обучение. Погружение в технологию. Артем Демиденко
Чтение книги онлайн.

Читать онлайн книгу Машинное обучение. Погружение в технологию - Артем Демиденко страница 6

СКАЧАТЬ алгоритм классификации и регрессии, основанный на принципе ближайших соседей. Модель классифицирует новый пример на основе ближайших к нему соседей из обучающей выборки.

      4.      Градиентный бустинг: Этот алгоритм используется для задач классификации и регрессии и основан на комбинировании слабых прогнозов (например, деревьев решений) для создания более сильной модели. Градиентный бустинг последовательно добавляет новые модели, корректируя ошибки предыдущих моделей.

      Это только несколько примеров алгоритмов обучения с учителем, и в области Машинного обучения существует множество других алгоритмов и методов, которые можно применять в зависимости от конкретной задачи и типа данных.

      Обучение без учителя: в этом подходе модель обучается на основе не размеченных данных, то есть данных без явно указанных выходных меток. Цель состоит в том, чтобы найти скрытые закономерности, структуры или группы в данных. Задачи кластеризации и понижения размерности являются примерами обучения без учителя. В этом случае модель сама находит внутренние структуры в данных, не требуя явных ответов. Целью обучения без учителя является нахождение скрытых закономерностей, структур или групп в данных.

      Некоторые из примеров задач обучения без учителя:

      1.      Кластеризация: В задачах кластеризации модель группирует объекты по их сходству без заранее заданных классов или категорий. Это позволяет выявить внутренние структуры в данных и идентифицировать группы схожих объектов. Примером алгоритма для кластеризации является k-средних (k-means).

      2.      Понижение размерности: Задача понижения размерности состоит в сокращении размерности данных, сохраняя при этом важные информационные характеристики. Это полезно для визуализации данных, удаления шума или избыточных признаков. Примерами алгоритмов понижения размерности являются метод главных компонент (PCA) и алгоритм t-SNE.

      3.      Ассоциативное правило: В этой задаче модель ищет статистические связи и ассоциации между различными элементами в наборе данных. Примером является алгоритм Apriori, который используется для нахождения часто встречающихся комбинаций элементов (таких как товары в корзине покупок).

      Обучение без учителя полезно для обнаружения структур в данных и получения инсайтов о них, когда отсутствуют явные метки или целевые переменные. Этот подход позволяет модели самой извлекать информацию из данных и обнаруживать их скрытые характеристики.

      1.5 Метрики и оценка производительности моделей

      Оценка производительности моделей является важной частью процесса Машинного обучения. Для этого используются различные метрики, которые позволяют оценить, насколько хорошо модель справляется с поставленной задачей. Применение соответствующих метрик играет важную роль в измерении и сравнении производительности моделей. Вот более подробное описание некоторых метрик и методов оценки производительности:

      1.      В СКАЧАТЬ