#python #pandas #csv #data-science
Вопрос:
У меня есть два CSV-файла, CSV_Cleaned: в нем 891 строка и CSV_Uncleaned: в этом файле 945 строк, я хочу получить только те строки из CSV_Uncleaned, значение индекса которых совпадает с CSV_Cleaned. Как мне это сделать?
ПРИМЕЧАНИЕ: В моем фрейме данных нет столбца с именем «индекс», я говорю о значениях индекса, которые автоматически генерируются слева от 1-го столбца.
Ответ №1:
предполагая, что интересующий столбец вызывается "index"
в файлах csv, вы можете сделать это с помощью слияния
df1 = pd.read_csv('CSV_cleaned.csv')
df2 = pd.read_csv('CSV_Uncleaned.csv')
df = df1.merge(df2, left_on='index', right_on='index', how='left')
в случае, если у вас уже есть DataFrame
s, которые необходимо объединить по их индексу:
df = df1.merge(df2, left_index=True, right_index=True, how='left')
Комментарии:
1. Нет , я говорю о столбце индекса, который в любом случае генерирует pandas
2. Большое спасибо, @Mateo. Ты решил мою проблему. Я желаю вам отлично провести время PS-Извините за задержку с ответом
3. @AbhinavPipil Если ответ устранил вашу проблему, пожалуйста, подумайте о том, чтобы принять ответ 🙂
4. Извините, что это вылетело у меня из головы, теперь я принял ваш ответ 🙂