Предсказываем тренды. С Rattle и R в мир моделей классификации. Александр Фоменко
Чтение книги онлайн.

Читать онлайн книгу Предсказываем тренды. С Rattle и R в мир моделей классификации - Александр Фоменко страница 34

СКАЧАТЬ инструментом в виде графического интерфейса пользователя (GUI) (Уильямс, 2009b). Он определенно разрабатывался для упрощения перехода от первых прикидочных шагов к созданию предсказательных моделей, что предполагает наличие GUI, к сложным вариантам предсказательных моделей с использованием мощного статистического языка R.

      Rattle объединяет множество пакетов R, которые важны для построения предсказательных моделей, но часто не легки для использования новичком. На первоначальном этапе применения Rattle понимание R не требуется. Пользовательский интерфейс Rattle открывает дверь в R как инструмента статистического моделирования данных.

      12.3. Построение модели

      Rattle определенно использует простую концепцию, основанную на вкладках, для пользовательского интерфейса, выполняя операции над данными в соответствии с назначением вкладки. Типичный поток операций следует с левой вкладки (вкладка Data – Данные) направо (вкладка Log – Журнал). Для любой вкладки пользователь должен указать доступные параметры, а затем нажать кнопку Выполнить (или F2), чтобы выполнить соответствующую задачу. Строка состояния внизу окна укажет завершение действия.

      Можно показать, что очень просто, если нереалистично, Rattle создает предсказательную модель всего четырьмя щелчками мышью. Запускаем R, загружаем пакет Rattle и даем команду Rattle (). Затем:

      – щелкаем по кнопке Выполнить;

      – щелкаем по Yes в раскрывшемся окне;

      – щелкаем по вкладке Model;

      – щелкните по кнопке Выполнить.

      На основе демонстрационных данных мы получили предсказательную модель классификационного типа в виде дерева решений.

      Одним или еще двумя щелчками могут быть созданы альтернативные модели. Еще несколькими щелчками получим на мониторе диаграмму оценки для сравнения результативность созданных моделей. Затем еще пара щелчков – и применили обученные на первом этапе модели на новых наборах данных.

      Конечно, применимость древовидной модели на финансовых рынках крайне ограниченна. Но простой пример наглядно демонстрирует простоту применения Rattle.

      Общие шаги при проектировании предсказательной модели в итоге выглядит как:

      – загрузите исходные данные (Source) в одном из возможных форматов и выберите переменные и назначьте их роли.

      – исследуйте (Explore) данные, чтобы понять распределения.

      – протестируйте (Test) распределения;

      – преобразуйте (Transform) данные, чтобы удовлетворить моделированию.

      – создайте Модели (Model);

      – оцените (Evaluate) модели на разных наборах данных.

      – рассмотрите Log (Журнал) процесса предсказания целевой переменной.

      Код R, созданный и выполняемый Rattle, записан в журнале, доступном на вкладке Log, вместе с поучительными комментариями. СКАЧАТЬ