Основы статистической обработки педагогической информации. Денис Владимирович Соломатин
Чтение книги онлайн.

Читать онлайн книгу Основы статистической обработки педагогической информации - Денис Владимирович Соломатин страница 16

СКАЧАТЬ + coord_flip()

      bar + coord_polar()

      Упражнения

      1. Преобразуйте линейчатую диаграмму с накоплением в круговую диаграмму с помощью coord_polar().

      2. Где и как используется функция labs()? Ознакомьтесь с документацией.

      3. В чем разница между coord_quickmap() и coord_map()?

      4. Почему важно применение coord_fixed()? Что делает функция geom_abline()?

      5. Выполните аналогично разобранной визуализацию успеваемости учеников своего класса.

      Выше было показано как создавать диаграммы рассеяния, гистограммы и прямоугольные-диаграммы. После закрепления на практике сформировался навык, легко применимый к освоению диаграмм ggplot2 любого типа. Чтобы закрепить изученное, добавим настройки положения, статистическую обработку, настройки системы координат и разбиение данных к исходному шаблону кода:

      ggplot(data = <данные>) +

      <geom_основная функция графопостроителя>(

      mapping = aes(<сопоставления с координатными осями и эстетикой>),

      stat = <сбор дополнительной статистики>,

      position = <позиция фрагментов диаграммы>

      ) +

      <настройка координатной системы> +

      <функция группирования данных>

      Новый шаблон принимает семь параметров (заключенные в угловые скобки), которые применяются для описания желаемой визуализации данных. На практике редко приходится заполнять их все, чтобы построить график, так как в ggplot2 используются оптимальные значения по умолчанию для всего кроме данных, сопоставлений с осями и выбора функции geom.

      Семь параметров в шаблоне составляют грамматику графопостроителя, формальную систему визуализации изображений. Грамматика основана на понимании того, что можно однозначно описать любой участок кода как комбинацию набора данных, функции графопостроителя, набора соответствий, статистической обработки, настройки положения фрагментов чертежа, системы координат и схемы группирования подмножеств исходных данных.

      Чтобы понять, как это работает, вспомните, как строился простейший график с самого начала: фиксировался набор данных, затем выполнялась статистическая обработка для извлечения вспомогательной информации. Далее, выбирался способ представления каждого исходного значения и новых данных. При этом настраивались эстетические свойства геометрических примитивов, чтобы сопоставление значений каждой переменной с положением, цветом или формой объекта несло определенную смысловую нагрузку. Затем выбирали систему координат, чтобы в ней наглядно разместить полученное изображение, это само по себе тоже несет определенную эстетику, сопоставляя значения переменных с x и y. В результате получался график, но опционально ещё настраивалось местоположение объектов внутри системы координат (корректировка положения) и разбиение графика на подграфики (фасетирование). Также можно было улучшить изображение, добавив один или несколько дополнительных слоёв, на каждом из которых использовался свой набор данных, функция графопостроителя, набор сопоставлений, собиралась дополнительная статистика и регулировалось положение.

      При помощи описанного метода строятся графики практически любой сложности. Другими СКАЧАТЬ