#html #css #jsoup
#HTML #css #jsoup
Вопрос:
ВСЕ. Я использую jsoup css селектор для очистки веб-страницы, но не знаю, как получить текст между 2 тегами. как показано ниже:
<html>
<body>
<a
name = «xxx» >
здесь немного текста </a>
<a
name = «abc» >
текст 1 </a
>`
я хочу получить текст здесь
<a
name = «cde» >
текст 1 </a>
</body>
</html>
имя атрибута <a>
уникально в hmtl
Я обнаружил, что большинство ответов заключались в извлечении текста между <a>
</a>
кто-нибудь знает, как это сделать. большое спасибо
Ответ №1:
Хорошо, я заставил этот небольшой код работать на меня
String html = "<html> <body><a name = xxx > some text here</a><a name = abc> the text 1 </a>i wanna get the text here<a name = cde>the text 1 </a></body></html>";
Document doc = Jsoup.parse(html);
String body = doc.body().toString();
String[] a = body.split("</a>");
String lista = a[2];
String[] listb = lista.split("<");
String textBetweenA = listb[0];
System.out.println(textBetweenA);
Комментарии:
1. @aeTechMoy, это не работает. пожалуйста, проверьте, обновлен ли мой исходный код html. перед тегом <a> ни один элемент не содержит тега <a>.