Модуль HtmlUnit считывает определенную информацию о ссылке между тегами

#parsing #hyperlink #html-parsing #htmlunit

#синтаксический анализ #гиперссылка #html-синтаксический анализ #htmlunit

Вопрос:

Я подключаюсь к веб-странице с помощью HtmlUnit и хочу прочитать информацию между тегами. Я продемонстрирую, используя некоторый код. Предположим, у меня есть следующая ссылка:

 <a href="www.anypage.com"> Hello! </a>
  

Я хотел бы прочитать Hello промежуточную информацию, желательно сохраненную в String переменной. Вот код, необходимый для выполнения задачи

 // Simulating a Chrome browser
WebClient webClient = new WebClient(BrowserVersion.CHROME); 
loggedIn = webClient.getPage("random-page.com");
HtmlAnchor anchorLink = loggedIn.getAnchorByHref("/private-messages/inbox");
  

Теперь, если я использую anchorLink.toString() , я получаю <a href="www.anypage.com"> из предыдущего примера, но ничего о символах между тегами. Я прошел через API и, похоже, не могу найти ничего полезного. Какие-либо обходные пути?

Ответ №1:

getTextContent() Было бы то, что вы ищете?