#python #selenium #beautifulsoup
#python #селен #beautifulsoup
Вопрос:
from urllib.request import urlopen as uReq
from requests import get
from bs4 import BeautifulSoup as soup
import tablib
my_url = 'https://tradingeconomics.com/india/indicators'
uClient2 = uReq(my_url)
page_html = uClient2.read()
uClient2.close()
page_soup = soup(page_html, "html.parser")
containers11 = page_soup.findAll("div",{"class":"tab-pane"})
filename = "tradeeconomics.csv"
f = open(filename, "w", encoding='utf-8-sig')
headers = "GDP, Last, Reference,Previous,Range,Frequencyn"
f.write(headers)
for container in containers11:
title_container = container.findAll("div",{"class":"col-md-4 col-xs-5"})
print(title_container)
f.close()
Ответ №1:
На самом деле вам не нужно BeautifulSoup
получать таблицы.
Возможно, вы захотите попробовать pandas
.
Например:
import pandas as pd
import requests
html = requests.get("https://tradingeconomics.com/india/indicators").text
df = pd.read_html(html, flavor="bs4")[1]
df.to_csv("trade_economics.csv", index=False)
Вывод:
Комментарии:
1. но с помощью этого метода невозможно извлечь другие табличные данные ВВП, рабочая сила, цена и т. Д
2. Используйте
df
индексацию, чтобы получить нужную таблицу.