#for-loop #row #imputation
#для-петли #ряд #вменение
Вопрос:
У меня есть база данных, похожая на
Company Date Sales A 2008 145 A 2009 100 A 2010 50 B 2009 70 B 2010 60 C 2009 50 D 2008 40 D 2009 60 D 2010 70 D 2011 80
Теперь я хочу сделать сбалансированные панельные данные, и для этого мне нужно, чтобы у всех компаний были данные за равные периоды, например, здесь я хочу за 2008-2010 годы. Таким образом, для компаний, для которых существует нехватка данных, создается пустая строка с указанным годом, а для компаний, для которых есть избыток, эти точки данных удаляются. Поэтому я хочу получить окончательные данные в виде
Company Date Sales A 2008 145 A 2009 100 A 2010 50 B 2008 B 2009 70 B 2010 60 C 2008 C 2009 50 C 2010 D 2008 40 D 2009 60 D 2010 70
Любая помощь в том, как достичь этого в R, учитывая, что в моей базе данных почти 5000 компаний.