#xml #xpath
#xml #xpath
Вопрос:
Прежде всего, спасибо за ваше время.
Я хочу выбрать информацию из некоторых веб-страниц, и у меня возникают проблемы с любыми подобными выражениями.
<a class="xxxxx">
<br>
Hi
<br>
<span class="hpn">City</span>
: Barcelona
<br>
<span class="hpn">color</span>
: Blue
<br>
<span class="hpn">Price</span>
: 50
<br>
Я хочу выбрать информацию о цвете города и цене с результатами Барселона, синий, 50
Я жду ваших ответов!
Комментарии:
1. Мы ждем, когда вы покажете нам, что вы уже пробовали.
2. Есть ли причина для использования Xpath? Почему бы не использовать регулярное выражение для извлечения информации. Приведенный выше пример на самом деле HTML, а не XML?
Ответ №1:
В отсутствие какой-либо другой информации, включая ваши знания Xpath, я бы направил вас к руководству по Xpath.
Ответ №2:
Поскольку приведенный выше текст представляет собой HTML, а не XML (хотя вы пометили его как XML), я не думаю, что вы сможете заставить его работать как есть. Приведенный выше фрагмент не может быть интерпретирован как правильно сформированный XML, если вы не добавите закрывающие теги для <a>
тега (предположим, вы просто забыли скопировать это), но также все <br>
теги должны быть самозакрывающимися <br/>
, чтобы это было проанализировано. Поскольку я не знаю, на каком языке вы собираетесь попробовать это (не указано), возможно, ваш анализатор будет работать нормально, но все же я опасаюсь за результат запроса XPath. Но предполагая, что это сработает, запрос типа
//a[@class='xxxxx']/span[text()='City']/following-sibling::text()[1]
вернет ‘: Barcelona’ (вы можете добавить его в подстроку, чтобы удалить часть ‘: ‘)
или
//a[@class='xxxxx']/span/following-sibling::text()[1]
вернет первые родственные файлы после каждого класса span