#node.js #parsing #html-parsing
Вопрос:
Я анализирую страницу с качанием, где меня интересует цена, но по какой-то причине запрос HTTPS.get возвращает старый исходный код HTML. Я попытался установить заголовки — это не помогло.
const HTTPS = require('https'); HTTPS.get('https://www.obi.ru/sadovye-kacheli/sadovye-kacheli-greengard-santorini-bordo/p/4480281', { headers: { 'Content-Type': 'text/html', 'Cache-Control': 'private, no-cache, no-store, must-revalidate', 'Expires': '-1', 'Pragma': 'no-cache', }, }, (resp) =gt; { resp.on('data', async (chunk) =gt; { const OUTPUT_HTML = bufferParse(chunk); }); });
OUTPUT_HTML содержит старый HTML, который уже был проанализирован ранее (с помощью CRON каждый день в 5:00 утра). Из HTML я извлекаю значение productCost. Я отрезал часть кода, показав только то, как я получаю HTML-код страницы. Теперь переменная productCost имеет значение 13990, и если я открою страницу из браузера, а затем открою исходный код страницы (CTRL U), то productCost там равен 16990.