Как объединить два CSV-файла с общими значениями индексов в Python с помощью pandas?

#python #pandas #csv #data-science

Вопрос:

У меня есть два CSV-файла, CSV_Cleaned: в нем 891 строка и CSV_Uncleaned: в этом файле 945 строк, я хочу получить только те строки из CSV_Uncleaned, значение индекса которых совпадает с CSV_Cleaned. Как мне это сделать?

ПРИМЕЧАНИЕ: В моем фрейме данных нет столбца с именем «индекс», я говорю о значениях индекса, которые автоматически генерируются слева от 1-го столбца.

Ответ №1:

предполагая, что интересующий столбец вызывается "index" в файлах csv, вы можете сделать это с помощью слияния

 df1 = pd.read_csv('CSV_cleaned.csv')
df2 = pd.read_csv('CSV_Uncleaned.csv')
df = df1.merge(df2, left_on='index', right_on='index', how='left')
 

в случае, если у вас уже есть DataFrame s, которые необходимо объединить по их индексу:

 df = df1.merge(df2, left_index=True, right_index=True, how='left')
 

Комментарии:

1. Нет , я говорю о столбце индекса, который в любом случае генерирует pandas

2. Большое спасибо, @Mateo. Ты решил мою проблему. Я желаю вам отлично провести время PS-Извините за задержку с ответом

3. @AbhinavPipil Если ответ устранил вашу проблему, пожалуйста, подумайте о том, чтобы принять ответ 🙂

4. Извините, что это вылетело у меня из головы, теперь я принял ваш ответ 🙂