Очистка кэшированных страниц

#python #scrapy #browser-cache

#python #scrapy #браузер-кэш

Вопрос:

Я использую scrapy для извлечения некоторого веб-контента таким образом:

 class PitchforkTracks(scrapy.Spider):
    name = "pitchfork_tracks"
    allowed_domains = ["pitchfork.com"]
    start_urls = [
                    "http://pitchfork.com/reviews/best/tracks/?page=1",
                    "http://pitchfork.com/reviews/best/tracks/?page=2",
                    "http://pitchfork.com/reviews/best/tracks/?page=3",
     ]

все работает нормально.

теперь, вместо прямого доступа к страницам, я хотел бы очистить google caches одни и те же страницы.

как правильно syntax этого добиться?

PS: Я пытался "cache:http://pitchfork.com/reviews/best/tracks/?page=1", , но безрезультатно.

Ответ №1:

вы можете использовать следующий URL-адрес Google для очистки страницы кэша

http://webcache.googleusercontent.com/search ?q=кэш: http://pitchfork.com/обзоры / лучшие / треки /?страница =1

Вопрос:

Ответ №1:

Вам также может понравиться

событие lib — Http-сервер — Обратный вызов прекращается для запуска

Typescript HTMLInputElement из getByLabelText

Щелкните правой кнопкой мыши меню на графическом элементе LocatorPane в Mathematica