#javascript #php #curl
#javascript #php #curl
Вопрос:
Когда я приношу www.amazon.com с помощью запроса curl get я не получаю версию страницы js. Мой запрос выглядит так:
$ch = curl_init ($url );
$header[0] = "Accept: text/xml,application/xml,application/xhtml xml,";
$header[0] .= "text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5";
$header[] = "Accept-Language: en-us,en;q=0.5";
$header[] = "Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7";
$header[] = "Accept-Encoding: deflate";
curl_setopt($ch, CURLOPT_HTTPHEADER, $header);
curl_setopt ($ch, CURLOPT_COOKIEJAR, $ckfile);
curl_setopt ($ch, CURLOPT_COOKIEFILE, $ckfile);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION,1);
curl_setopt ($ch, CURLOPT_SSL_VERIFYPEER,0);
$res = curl_exec($ch);
Комментарии:
1. Невозможно сказать наверняка, но я бы предположил, что они проверяют заголовок User-Agent, который вы не отправляете. Попробуйте добавить один.
2. Я думаю, что они пересаживают файл cookie, а затем проверяют его. Я могу воспроизвести это, отключив js в браузере
3.
User-agent
Попробуйте отключить как cookie, так и js в обычном браузере, и вы все равно получите скрипты на странице4. Я попробовал и получил версию страницы без использования js