Использование Jsoup CSS селектора для текста между 2 элементами

#html #css #jsoup

#HTML #css #jsoup

Вопрос:

ВСЕ. Я использую jsoup css селектор для очистки веб-страницы, но не знаю, как получить текст между 2 тегами. как показано ниже:

<html>
<body>

<a name = «xxx» > здесь немного текста </a>

<a name = «abc» > текст 1 </a >`

я хочу получить текст здесь

<a name = «cde» > текст 1 </a>

 </body>
</html>
  

имя атрибута <a> уникально в hmtl

Я обнаружил, что большинство ответов заключались в извлечении текста между <a> </a>

кто-нибудь знает, как это сделать. большое спасибо

Ответ №1:

Хорошо, я заставил этот небольшой код работать на меня

 String html = "<html> <body><a name = xxx > some text here</a><a name = abc> the text 1 </a>i wanna get the text here<a name = cde>the text 1 </a></body></html>";
    Document doc = Jsoup.parse(html);
    String body = doc.body().toString();
    String[] a = body.split("</a>");
    String lista = a[2];
    String[] listb = lista.split("<");      
    String textBetweenA = listb[0];
    System.out.println(textBetweenA);
  

Комментарии:

1. @aeTechMoy, это не работает. пожалуйста, проверьте, обновлен ли мой исходный код html. перед тегом <a> ни один элемент не содержит тега <a>.