Как исправить автоматически созданный индекс в dataframe по реальному индексу после получения данных из pd.read_html

#python #pandas #dataframe

#python #pandas #dataframe

Вопрос:

Я не могу найти, как правильно индексировать столбцы моего dataframe

Я попробовал несколько методов, но не смог найти правильный

 import pandas as pd

df = pd.read_html('sbi.html')
data = df[1]
  

Скриншот

я хочу, чтобы вторая строка была моим индексом столбцов, в которых есть «Повествование»

Ответ №1:

Установите header параметр в 1 :

 data = pd.read_html('sbi.html', header=1)[0]
  

Или используйте skiprows параметр:

 data = pd.read_html('sbi.html', skiprows=1)[0]
  

Комментарии:

1. Спасибо, это решило мою проблему data = pd.read_html('sbi.html', header=0)[1]