Как предсказать курс доллара. Поиск доходной стратегии с языком R. Владимир Георгиевич Брюков
Чтение книги онлайн.

Читать онлайн книгу Как предсказать курс доллара. Поиск доходной стратегии с языком R - Владимир Георгиевич Брюков страница 7

СКАЧАТЬ отличие от номинальных порядковые данные могут быть ранжированы как в порядке убывания, так и увеличения какого-либо их качества. Но в отличие от обычных количественных данных, которые можно выразить в конкретных единицах и к которым можно применить широкий круг алгебраических операций, к порядковым данным можно применить лишь операции «равенство-неравенство», а также «больше-меньше». Порядковые данные используются в том случае, когда порядок ранжирования элементов по какому-то критерию важен, а вот количественные различия между различными рангами этих элементов не поддаются точной оценке.

      Например, такие ответы респондентов на вопрос социолога, как: «согласен», «частично согласен», «нет могу сказать, согласен или не согласен», «частично не согласен», «не согласен», – можно ранжировать по степени их согласия или степени их несогласия, в то время как количественную разницу между вариантами этих ответов трудно оценить в каких-то конкретных единицах. Следовательно, эти данные являются порядковыми или ранжируемыми. Впрочем, иногда порядковым данным могут присваиваться какие-то условные порядковые числа, но и в этом случае количественная разница между различными рангами одной и той же последовательности носит весьма условный характер. Например, порядковыми данными являются пятибалльные оценки знаний учащихся, поскольку они не могут быть сгенерированы методом измерения в конкретных единицах, а получены методом достаточно субъективного оценивания.

      Созданная нами переменная Успеваемость относится к числу ранжируемых, но по умолчанию уровни фактора в R присваиваются текстовому вектору в алфавитном порядке. Поскольку переменная Успеваемость является порядковой, то такая градация в этом случае не подходит. Поэтому сначала проверим тип данных переменной Успеваемость, а затем присвоим значение различных уровней фактора в порядке возрастания успеваемости с помощью следующей команды:

      > class(Успеваемость)

      [1] "character"

      # тип данных – текстовый

      > Успеваемость <– factor(Успеваемость, order=TRUE, levels=c('Двоечники', 'Троечники', 'Хорошисты', 'Отличники'))

      # превращает вектор Успеваемость в упорядоченный фактор

      # число уровней фактора задается при помощи аргумента levels

      > Успеваемость

      [1] Отличники Хорошисты Троечники Двоечники

      # уровни фактора в порядке их возрастания

      Levels: Двоечники < Троечники < Хорошисты < Отличники

      > class(Успеваемость)

      [1] "ordered" "factor"

      # тип данных – упорядоченный фактор

      Список в R представляет собой упорядоченный набор объектов с различными типами данных. В результате под одним своим именем списки могут включать векторы, матрицы, таблицы и другие списки. Список можно создать при помощи функции list():

      > Мой.Список <– list(Моя.Таблица, Успеваемость, Матрица1,Матрица2)

      # по-русски: Мой.Список <– список(Моя.Таблица, Успеваемость, Матрица1,Матрица2)

      > Мой.Список

      [[1]]

      Успеваемость Студенты Студентки

      1 Отличники СКАЧАТЬ