#r
Вопрос:
У меня есть набор данных, содержащий заработную плату за перепись, проведенную в Италии. Номер 9999999 указывает, что соответствующий доход респондента технически равен НУЛЮ (недоступен). Я хочу запустить регрессию, но сначала мне нужно избавиться от всех элементов с 9999999 из массива.
Когда я запускаю следующий код:
data.frame(INCWAGE[1:10])
Я получаю результат:
1 9999999 2 9999999 3 1180 4 9999999 5 500 6 9999999 7 9999999 8 9999999 9 9999999 10 9999999
P.S. Я проверил дату, установленную для элементов с 1 по 10, чтобы просто решить проблему. Фактические данные содержат более 100 000 ответов, полученных в ходе переписи.
Ответ №1:
Попробуйте преобразовать свои данные в фрейм данных:
my_data= data.frame(my_data)
Затем запустите следующий код (при условии, что ваш столбец называется «A»)
new_data = subset(my_data, A!= 9999999)
Может быть, это сработает?