#r #sum
#r #сумма
Вопрос:
Я пытаюсь очистить большой набор данных. У меня есть код, который вернет уникальные значения столбца в таблице данных в R. Но когда я захожу, чтобы получить количество того, сколько раз встречается определенное значение, я получаю «NA». Любая помощь очень ценится.
> RtpStateBitfieldunique<-sort(unique(train$RtpStateBitfield))
> RtpStateBitfieldunique
[1] 0 1 3 5 7 8 35
> sum(is.na(train$RtpStateBitfield))
[1] 32318
> sum(train$RtpStateBitfield==35)
[1] NA
> sum(train$RtpStateBitfield=="35")
[1] NA
Комментарии:
1. Не могли бы вы предоставить выходные данные из
str(train$RtpStateBitfield)
?2. > str(обучить$RtpStateBitfield) int [1:8921483] 7 7 7 7 7 7 7 7 7 7 …
3. Выполнить
sum(train$RtpStateBitfield==35, na.rm = TRUE)
Ответ №1:
Чтобы получить количество данных, вы можете использовать table
функцию:
> table(train$RtpStateBitfield)
Однако это не даст вам количество значений, которые есть NA
. Для того, чтобы получить количество NA
‘s, вы можете использовать
> sum(is.na(train$RtpStateBitfield))
Комментарии:
1. Или
table(train$RtpStateBitfield, useNA = "always")
2. Да, подход @DanY лучше.