Получение количества значений в столбце

#r #sum

#r #сумма

Вопрос:

Я пытаюсь очистить большой набор данных. У меня есть код, который вернет уникальные значения столбца в таблице данных в R. Но когда я захожу, чтобы получить количество того, сколько раз встречается определенное значение, я получаю «NA». Любая помощь очень ценится.

 > RtpStateBitfieldunique<-sort(unique(train$RtpStateBitfield))
> RtpStateBitfieldunique
[1]  0  1  3  5  7  8 35
> sum(is.na(train$RtpStateBitfield))
[1] 32318
> sum(train$RtpStateBitfield==35)
[1] NA
> sum(train$RtpStateBitfield=="35")
[1] NA
  

Комментарии:

1. Не могли бы вы предоставить выходные данные из str(train$RtpStateBitfield) ?

2. > str(обучить$RtpStateBitfield) int [1:8921483] 7 7 7 7 7 7 7 7 7 7 …

3. Выполнить sum(train$RtpStateBitfield==35, na.rm = TRUE)

Ответ №1:

Чтобы получить количество данных, вы можете использовать table функцию:

 > table(train$RtpStateBitfield)
  

Однако это не даст вам количество значений, которые есть NA . Для того, чтобы получить количество NA ‘s, вы можете использовать

 > sum(is.na(train$RtpStateBitfield))
  

Комментарии:

1. Или table(train$RtpStateBitfield, useNA = "always")

2. Да, подход @DanY лучше.