запрос page.goto на веб-страницу продолжает загружаться с networkidle0 в puppeteer

#puppeteer

#puppeteer

Вопрос:

когда используется

 page.on('request', req => {
      try {
        const whitelist = ['document', 'script', 'xhr', 'fetch'];
        requestUrl = req.url();
        if (!whitelist.includes(req.resourceType())) {
          return req.abort();
        }
        req.continue();
      } catch(err) {
        console.log(err);
      }
    });
await page.goto("https://b2b.qq.com/busin?keywords=输送机" , {waitUntil: 'networkidle0', timeout: 0});
result = await page.content();
  

Запрос не может вернуть никакого результата.Похоже, что страница не может быть загружена даже с достаточным количеством времени.как я могу отладить puppeteer, чтобы выяснить, почему он продолжает загружаться и не может вернуть результат.

Кстати, URL-адрес можно загрузить в браузере.

Комментарии:

1. я обнаружил, что page.on выполняется в режиме цикла, почему?

Ответ №1:

Если вы добавите журналы консоли для типа запроса и URL, вы увидите, что страница бесконечно пытается загрузить изображение с URL https://btrace.qq.com/kvcollect?...many tracing data . Возможно, код сайта проверяет это изображение, и если оно не загружено, он пытается снова бесконечно.

Комментарии:

1. Как вы сказали, я прерываю запрос изображения, но приведенный выше URL-адрес является URL-адресом отчета о данных. Он будет отправлен повторно, если был прерван. Спасибо.