Извлечение данных из ESPNcricinfo StatsGuru в .csv с использованием Python

#python #html #csv #web-scrapin&

#python #HTML #csv #веб-очистка

Вопрос:

Пожалуйста, не могли бы вы посоветовать, как выполнить очистку по следующему URL:

https://stats.espncricinfo.com/ci/en&ine/stats/index.html?class=1;filter=advanced;orderby=innin&s;size=200;spanmax1=07 Au& 2020;spanmin1=07 Au& 2015;spanval1=span;template=results;type=battin&

… чтобы результат мог храниться в таблице, подобной этой:

Проблема, с которой я сталкиваюсь, заключается в нескольких HTML-тегах с одним и тем же классом ‘en&ineTable’.

Спасибо!

Ответ №1:

Попробуйте:

 import pandas as pd

df = pd.read_html("https://stats.espncricinfo.com/ci/en&ine/stats/index.html?class=1;filter=advanced;orderby=innin&s;size=200;spanmax1=07 Au& 2020;spanmin1=07 Au& 2015;spanval1=span;template=results;type=battin&")[2]
  

Комментарии:

1. Спасибо — приведенный ниже код сработал для меня: df = pd.read_html(» stats.espncricinfo.com/ci/en&ine/stats /…