Как мне удалить пустую строку и столбцы из следующего вывода?

#python #pandas

#python #pandas

Вопрос:

Я хочу экспортировать веб-страницу с уродливым кодом в чистый CSV-файл, чтобы я мог работать с ним без головной боли. Что я получаю в своем CSV:

Я просмотрел множество других решений и нашел несколько руководств, которые привели меня туда, где я нахожусь до сих пор, но теперь у меня остался столбец » и строка «. Любые корректировки, которые я пытаюсь внести в отношении «, NaN, None и т. Д., Похоже, отрицательно влияют на результат. Мои попытки .dropna() и .replace(…) были напрасными.

 import pandas as pd
pd.reset_option('max_rows')
pd.reset_option('max_columns')
pd.set_option('display.width', 800)
url="https://www.beatsbydre.com/de/support/service-warranty"
df = pd.read_html(url)

with pd.option_context('display.max_rows', 0, 'display.max_columns', 3):

    df[3].replace(to_replace=r'^Pill XL*', value='', regex=True).replace(to_replace=r'^R.*', value='', regex=True).to_csv("beats.csv", header=None, index = False)
 

В идеале у меня не будет больше строк или столбцов, которые мне нужны, и я могу видеть, что продукты остались со вторичным столбцом, в котором указана цена.

В качестве альтернативы мне было бы интересно узнать, повезло ли кому-нибудь с командой .replace и вводом значения NaN. Когда я пытаюсь, он вводит его как строку, а не как атрибут в dataframe, что может дать мне больше возможностей для избавления от пустых атрибутов.

Комментарии:

1. Это может помочь на самом деле привести пример желаемого и фактического вывода вместо описания его текстом.

2. Я только что запустил ваш код и при чтении созданного csv. Фрейм данных на самом деле выглядит хорошо для меня.

3. @VnC, я приложил скриншот. Меня беспокоит, что я вижу пустую строку в середине и столбец справа… У вас этого нет?