#puppeteer
#puppeteer
Вопрос:
когда используется
page.on('request', req => {
try {
const whitelist = ['document', 'script', 'xhr', 'fetch'];
requestUrl = req.url();
if (!whitelist.includes(req.resourceType())) {
return req.abort();
}
req.continue();
} catch(err) {
console.log(err);
}
});
await page.goto("https://b2b.qq.com/busin?keywords=输送机" , {waitUntil: 'networkidle0', timeout: 0});
result = await page.content();
Запрос не может вернуть никакого результата.Похоже, что страница не может быть загружена даже с достаточным количеством времени.как я могу отладить puppeteer, чтобы выяснить, почему он продолжает загружаться и не может вернуть результат.
Кстати, URL-адрес можно загрузить в браузере.
Комментарии:
1. я обнаружил, что page.on выполняется в режиме цикла, почему?
Ответ №1:
Если вы добавите журналы консоли для типа запроса и URL, вы увидите, что страница бесконечно пытается загрузить изображение с URL https://btrace.qq.com/kvcollect?...many tracing data
. Возможно, код сайта проверяет это изображение, и если оно не загружено, он пытается снова бесконечно.
Комментарии:
1. Как вы сказали, я прерываю запрос изображения, но приведенный выше URL-адрес является URL-адресом отчета о данных. Он будет отправлен повторно, если был прерван. Спасибо.