#c# #html-agility-pack
#c# #html-agility-pack
Вопрос:
Я пытался проанализировать следующую страницу. ‘https://marumaru.sale/bbs/cmoic/19997 ‘ И получите их список…
' <td class="list-subject">
<a href="/bbs/cmoic/19997/137207">'
//The list should have...
/bbs/cmoic/19997/137207
/bbs/cmoic/19997/137206
/bbs/cmoic/19997/137205
...etc
Может кто-нибудь помочь мне сделать это с помощью HtmlAgilityPack, пожалуйста?
Ответ №1:
private List<string> ExtractAllAHrefTags(HtmlAgilityPack.HtmlDocument htmlSnippet)
{
List<string> hrefTags = new List<string>();
foreach (HtmlNode link in htmlSnippet.DocumentNode.SelectNodes("//a[@href]"))
{
HtmlAttribute att = link.Attributes["href"];
hrefTags.Add(att.Value);
}
return hrefTags;
}
foreach (var item in hrefTags)
{
if(item.IndexOf(@"/bbs/cmoic/")>-1)
{
if (!epilist1.Contains(item))
{
epilist1.Add(site1 item);
}
}
}
Это сработало.