Синтаксический анализ с помощью SimpleHTMLPArser

#php #parsing

#php #синтаксический анализ

Вопрос:

Люди,

Я использую SIMPLEHTMLPARSER.

Я не могу разобрать HTML, когда я var_dump html-документ, он просто показывает структуру DOM и никакого содержимого HTML.

 $produrl = 'http://wap.ebay.com/Pages/ViewItem.aspx?aid=160586179890amp;sv=160586179890/';

var_dump(file_get_html($produrl));




   $html = file_get_html($produrl);
    var_dump($html->find('div[id=Teaser_Item] img[src]', 0));
  

На самом деле, то, что я хочу извлечь, это файл SRC IMG, который:

http://wap.ebay.com/Pages/RbHttpHandler.ashx?width=51amp;height=240amp;fsize=999000amp;format=jpgamp;url=http://i.ebayimg.com/00/$(KGrHqN,!jEE2n(iTLozBNwBPG0bUg~~0_1.JPG?set_id=8800005007

кто-нибудь может помочь мне отладить это, пожалуйста?

Приветствую Наташу Томас

Комментарии:

1. div[id=Teaser_Item] — вы пробовали заключать Teaser_Item в двойные кавычки?

2. Дорогой Пит, когда я добавляю «Teaser_Item», var_dump выдает NULL. 🙁

3. Этот код не определяет, что $html такое. Включен ли у вас error_reporting с включенными уведомлениями? Должно ли это быть $html = file_get_html ( $produrl );

4. Дорогой Джадда, я обновил свой код, как вы сказали, по-прежнему он не выводит содержимое HTML, а просто расширенную структуру DOM.

5. Привет, я использую последнюю версию WAMP, поэтому я думаю, что PHP там PHP 5.2.0.

Ответ №1:

 <?php
 require_once('simple_html_dom.php');

 $produrl = 'http://wap.ebay.com/Pages/ViewItem.aspx?aid=160586179890amp;sv=160586179890/';

 // Grab the document
 $html = file_get_html($produrl);

 // Find the img tag in the Teaser_Item div
 $a = $html->find('div[id=Teaser_Item] img', 0);

 // Display the src
 echo($a->attr['src']);

 ?>
  

Комментарии:

1. Когда я запускаю этот код, я получаю эту ошибку: Обратите внимание: Попытка получить свойство не-объекта в E:wampwwwdompebay_img_src.php в строке 13 и 13 находится echo($ a-> attr[‘src’]); Я должен упомянуть, что я тестирую его на своем локальном хостинге с помощью WAMP.

2. Вы настроили require_once в качестве вашего пути?