Перебор URL-адресов без подстановочных знаков

#python #selenium #url #wildcard

Вопрос:

Я в замешательстве от этого.Код Python предназначен для перебора URL-адресов с использованием подстановочного знака*, который заменяет только уникальный идентификатор для каждого совпадения. Проблема с этим шаблоном URL http://www.sportal.de/fussball/bundesliga/spielernoten-bayern-muenchen-fc-schalke-04-1-spieltag-2020-2021-20138500, является ли тот текст, который должен быть подстановочным, стоит между инвариантной частью URL-адреса и идентификатором. Я новичок в кодировании вселенной и действительно ценю любую помощь. Полный код находится здесь

 from time import sleep
from datetime import datetime
from selenium import webdriver
from selenium.webdriver.firefox.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
import pandas as pd

errors = []
season = []
for id in range(20138500, 20138501):
    # Opening the connection and grabbing the page
    my_url = f'http://www.sportal.de/fussball/bundesliga/spielernoten*{id}'
    option = Options()
    option.headless = False
    driver = webdriver.Firefox(options=option)
    driver.get(my_url)
 

Ответ №1:

Браузер должен знать точный URL-адрес. Вы должны указать весь URL-адрес

  my_url ="http://www.sportal.de/fussball/bundesliga/spielernoten-bayern-muenchen-fc-schalke-04-1-spieltag-2020-2021-" str(id)