Удаление определенного повторяющегося элемента в R

Вопрос:

У меня есть набор данных, содержащий заработную плату за перепись, проведенную в Италии. Номер 9999999 указывает, что соответствующий доход респондента технически равен НУЛЮ (недоступен). Я хочу запустить регрессию, но сначала мне нужно избавиться от всех элементов с 9999999 из массива.

Когда я запускаю следующий код:

 data.frame(INCWAGE[1:10])

Я получаю результат:

1 9999999 2 9999999 3 1180 4 9999999 5 500 6 9999999 7 9999999 8 9999999 9 9999999 10 9999999

P.S. Я проверил дату, установленную для элементов с 1 по 10, чтобы просто решить проблему. Фактические данные содержат более 100 000 ответов, полученных в ходе переписи.

Ответ №1:

Попробуйте преобразовать свои данные в фрейм данных:

 my_data= data.frame(my_data)

Затем запустите следующий код (при условии, что ваш столбец называется «A»)

 new_data = subset(my_data, A!= 9999999)

Может быть, это сработает?

Вопрос:

Ответ №1:

Вам также может понравиться

Как мне выбрать три верхние строки в моей базе данных для сообщений

Ввод вложенных файлов не работает в Firefox

`lsb_release -a` внутри докера `opensuse / tumbleweed`