#parsing #hyperlink #html-parsing #htmlunit
#синтаксический анализ #гиперссылка #html-синтаксический анализ #htmlunit
Вопрос:
Я подключаюсь к веб-странице с помощью HtmlUnit и хочу прочитать информацию между тегами. Я продемонстрирую, используя некоторый код. Предположим, у меня есть следующая ссылка:
<a href="www.anypage.com"> Hello! </a>
Я хотел бы прочитать Hello
промежуточную информацию, желательно сохраненную в String
переменной. Вот код, необходимый для выполнения задачи
// Simulating a Chrome browser
WebClient webClient = new WebClient(BrowserVersion.CHROME);
loggedIn = webClient.getPage("random-page.com");
HtmlAnchor anchorLink = loggedIn.getAnchorByHref("/private-messages/inbox");
Теперь, если я использую anchorLink.toString()
, я получаю <a href="www.anypage.com">
из предыдущего примера, но ничего о символах между тегами. Я прошел через API и, похоже, не могу найти ничего полезного. Какие-либо обходные пути?
Ответ №1:
getTextContent()
Было бы то, что вы ищете?