Название: Предсказываем тренды. С Rattle и R в мир моделей классификации
Автор: Александр Фоменко
Издательство: Издательские решения
Жанр: Компьютеры: прочее
isbn: 9785449663054
isbn:
Rattle объединяет множество пакетов R, которые важны для построения предсказательных моделей, но часто не легки для использования новичком. На первоначальном этапе применения Rattle понимание R не требуется. Пользовательский интерфейс Rattle открывает дверь в R как инструмента статистического моделирования данных.
12.3. Построение модели
Rattle определенно использует простую концепцию, основанную на вкладках, для пользовательского интерфейса, выполняя операции над данными в соответствии с назначением вкладки. Типичный поток операций следует с левой вкладки (вкладка Data – Данные) направо (вкладка Log – Журнал). Для любой вкладки пользователь должен указать доступные параметры, а затем нажать кнопку Выполнить (или F2), чтобы выполнить соответствующую задачу. Строка состояния внизу окна укажет завершение действия.
Можно показать, что очень просто, если нереалистично, Rattle создает предсказательную модель всего четырьмя щелчками мышью. Запускаем R, загружаем пакет Rattle и даем команду Rattle (). Затем:
– щелкаем по кнопке Выполнить;
– щелкаем по Yes в раскрывшемся окне;
– щелкаем по вкладке Model;
– щелкните по кнопке Выполнить.
На основе демонстрационных данных мы получили предсказательную модель классификационного типа в виде дерева решений.
Одним или еще двумя щелчками могут быть созданы альтернативные модели. Еще несколькими щелчками получим на мониторе диаграмму оценки для сравнения результативность созданных моделей. Затем еще пара щелчков – и применили обученные на первом этапе модели на новых наборах данных.
Конечно, применимость древовидной модели на финансовых рынках крайне ограниченна. Но простой пример наглядно демонстрирует простоту применения Rattle.
Общие шаги при проектировании предсказательной модели в итоге выглядит как:
– загрузите исходные данные (Source) в одном из возможных форматов и выберите переменные и назначьте их роли.
– исследуйте (Explore) данные, чтобы понять распределения.
– протестируйте (Test) распределения;
– преобразуйте (Transform) данные, чтобы удовлетворить моделированию.
– создайте Модели (Model);
– оцените (Evaluate) модели на разных наборах данных.
– рассмотрите Log (Журнал) процесса предсказания целевой переменной.
Код R, созданный и выполняемый Rattle, записан в журнале, доступном на вкладке Log, вместе с поучительными комментариями. СКАЧАТЬ