Основы статистической обработки педагогической информации. Денис Владимирович Соломатин
Чтение книги онлайн.

Читать онлайн книгу Основы статистической обработки педагогической информации - Денис Владимирович Соломатин страница 14

СКАЧАТЬ справка.

      Как известно, из всех систем оценивания знаний в России поныне жива 5-балльная, которая была в 1837 году официально установлена Министерством народного просвещения. Положим, что продемонстрированные воспитанницами на одном из уроков математики в Серпуховской женской гимназии результаты были занесены в следующую демонстрационную таблицу.

      library(tidyverse)

      demo <– tribble( ~оценка, ~количество,

      "слабо", 1,

      "посредственно", 1,

      "достаточно", 3,

      "хорошо", 2,

      "отлично", 3 )

      ggplot(data = demo) +

      geom_bar(mapping = aes(x = оценка, y = количество), stat = "identity")

      Не волнуйтесь, что не видели <– tribble раньше. Из контекста понятно назначение этих операторов, но что именно они делают в общем случае, будет подробно рассказано чуть позже.

      2) Возможно, потребуется переопределить сопоставление по умолчанию от трансформированных переменных. Например, можете чтобы отобразить линейчатую диаграмму частот, а не количества:

      library(tidyverse)

      demo <– tribble( ~оценка, "слабо", "посредственно",

      "достаточно", "достаточно", "достаточно",

      "хорошо", "хорошо",

      "отлично", "отлично", "отлично" )

      ggplot (data = demo) +

      geom_bar (mapping = aes (x = оценка, y = stat (prop), group = 1))

      Чтобы найти полный список переменных, вычисляемых в статистике, достаточно заглянуть в раздел справки, озаглавленный как «вычисляемые переменные».

      3) Возможно, захотите извлечь больше статистической информации в вашем коде. Например, если использовать функцию stat_summary(), то будет получена дополнительная описательная статистика, которую можно показать на диаграмме. Следующий фрагмент кода выберет из тестовой базы успеваемость обучающихся в 7а или 7б классах по теме 2, найдет наименьшую оценку в каждом классе, наибольшую и медианное значение. После этого найденные статистики будут отображены на диаграмме соответствующими линиями:

      ggplot(data = My_table[My_table$Класс == "7а" | My_table$Класс == "7б",]) +

      stat_summary(

      mapping = aes(x = Класс, y = Тема2),

      fun.ymin = min,

      fun.ymax = max,

      fun.y = median

      )

      На данном этапе развития проекта, пакет ggplot2 предоставляет пользователям более 20 статистик. Каждое значение параметра stat является функцией, поэтому получить справку по ним можно обычным способом, например, введя ?stat_bin в консоли.

      Упражнения

      1. Что такое geom по умолчанию, связанный с stat_summary()? Как переписать код из примеров, чтобы использовать функцию начинающуюся с geom_ вместо stat_?

      2. Что делает функция geom_col()? Чем она отличается от geom_bar()?

      3. Большинство значений параметров geom и stat парные, и почти всегда используется вместе. Ознакомьтесь с документацией и составьте список всех пар, что у них общего?

      4. Какие вспомогательные переменные вычисляет СКАЧАТЬ