#python #web-scraping #tableau-api
#python #очистка веб-страниц #tableau-api
Вопрос:
У меня возникли проблемы с доступом к таблице данных с панели инструментов Tableau (веб-сайт следующий: нажмите здесь). Я искал в Google несколько способов, и это помогло прийти к этому моменту. Я попробовал следующий код (основанный на другом потоке отсюда):
import requests
from bs4 import BeautifulSoup
import json
import re
urlPath = "BolsaUnicaemp3/Dashboard12"
r = requests.get(
f"https://public.tableau.com/views/{urlPath}",
params= {:showVizHome":"no", })
soup = BeautifulSoup(r.text, "html.parser")
tableauData = json.loads(soup.find("textarea",{"id": "tsConfigContainer"}).text)
dataUrl = f'https://public.tableau.com{tableauData["vizql_root"]}/bootstrapSession/sessions/{tableauData["sessionid"]}'
r = requests.post(dataUrl, data= {"sheet_id": tableauData["sheetId"],})
dataReg = re.search('d ;({.*})d ;({.*})', r.text, re.MULTILINE)
info = json.loads(dataReg.group(1))
data = json.loads(dataReg.group(2))
Когда я вижу последний r
запрос с info
помощью, я не могу найти нужную таблицу (нажмите здесь, чтобы увидеть ее скриншот). Все, что я нахожу, это текст выше, но ничего не связано с результатами (которые называются по-испански: Resultados). data
Переменная просто пуста, поэтому я там потерялся.
В этом потоке я НЕ требую от вас полного решения моей проблемы, просто предлагаю подход / функцию / пакет / поток / учебник, которые могли бы помочь мне извлечь эту информацию. Итак, у вас есть какие-либо предложения в этом случае?
Большое вам спасибо
Опять же, если вы чувствуете, что я говорю: «Выполняйте мою работу». это не мое намерение. Я просто застрял с очень конкретным вопросом, а именно: как получить доступ к таблице из общедоступной панели инструментов Tableau?
Комментарии:
1. Я не могу сказать, к какой панели инструментов вы пытаетесь получить доступ: URL-адрес просто переходит на сайт общего правительства. Но, если она опубликована в Tableau Public, издатель может сделать прямую загрузку данных или рабочего листа доступной или нет. получение данных с помощью веб-очистки кажется очень обходным путем, если они сделали данные общедоступными.
2. Мне очень жаль. Я ввел неправильный URL. Это следующее: buscadordeempleo.gov.co На этом веб-сайте есть подборка вакансий для Колумбии, но, похоже, у него нет возможности загрузить все данные, и это то, что мне нужно.