#r #excel #subset
#r #excel #подмножество
Вопрос:
У меня есть набор данных «Случаи» с более чем 16000 строками, который содержит 25 столбцов с различными кодами диагностики, по 1 коду на столбец. У меня также есть ключ, который содержит 56 уникальных диагностических кодов. Мне нужно разобрать коды, которые соответствуют кодам в ключе. Как я могу свести это к более сжатому набору данных? В общем, должен остаться только один код. К сожалению, у меня нет никакого кода для совместного использования, потому что я не знаю, с чего начать. Я открыт для использования Excel или R для этого. Заранее благодарю вас и заранее приношу извинения за то, насколько расплывчатый этот вопрос, я, честно говоря, просто не знаю, с чего начать.
Principal.DX DX2 DX3 DX4 DX5 DX6 DX7
1 D57.01 J18.9 Z86.711 Z79.01 Z87.891 E55.9
2 E66.2 J18.9 J96.21 J96.22 Z68.45 J20.9 I10
3 T82.7XXA A41.01 J18.9 N18.6 L03.114 L02.414 I12.0
4 J18.9 J96.21 R57.1 I42.0 I50.32 K52.1 N17.9
5 J10.08 J12.9 H66.91 L30.9
6 J15.212 E84.0 E44.0 J44.1 J15.6 K86.81
Итак, в этом примере, допустим, мне нужно сохранить только значения «J96.21», «J12.9» и «E55.9».
Комментарии:
1. пожалуйста, предоставьте репрезентативное подмножество ваших данных
2. Что вы хотите сохранить? Строки, содержащие определенный код? Столбцы, содержащие определенный код? Только ячейки , содержащие определенный код?
3. @Nuclear03020704 Я хочу сохранить только ячейку, содержащую один из интересующих кодов.
4. Можете ли вы уточнить, как будет выглядеть ваш ожидаемый результат? В R я бы, скорее всего, начал с замены ячеек, в которых эти значения не должны быть
NA
, но это не меняет размеровdata.frame
. Если это то, чего вы ожидаете, пожалуйста, укажите это. В противном случае, если вы ожидаете, что фрейм станет более компактным, тогда возникнут проблемы с асимметричными удалениями, что приведет к фрейму с несогласованной длиной столбцов (который больше не является фреймом).