C # HTMLAGILITYPACK извлекает href, где innertext = «Последний»

#c# #html-agility-pack

#c# #html-agility-pack

Вопрос:

я хочу извлечь href html-страницы с помощью HTMLAGILITYPACK.

Это строка на веб-странице:

 <a class="smallfont" href="http://example.com/fasdfsd" title="I am a title">Last <strong>»</strong></a>
  

Я пробовал это:

 document.DocumentNode.SelectNodes("//tr//td[@class='alt1']//a[@class='smallfont']//[@innertext='Last']")
  

Но это не работает.

Я надеюсь, что вы, ребята, сможете мне помочь

Комментарии:

1. //tr//td[@class='alt1']//a[@class='smallfont' and starts-with(text(),'Last')]

Ответ №1:

Поскольку у вас уже есть узлы, содержащие ссылки, вы можете выполнить следующие действия:

 var links = MyLinkNodes.Select(node=>node.Attributes["href"].Value).ToArray();