вопрос htmlagilitypack для анализа списка ссылок

#c# #html-agility-pack

#c# #html-agility-pack

Вопрос:

Я пытался проанализировать следующую страницу. ‘https://marumaru.sale/bbs/cmoic/19997 ‘ И получите их список…

 '   <td class="list-subject">
            <a href="/bbs/cmoic/19997/137207">'

//The list should have...
/bbs/cmoic/19997/137207
/bbs/cmoic/19997/137206
/bbs/cmoic/19997/137205
...etc
  

Может кто-нибудь помочь мне сделать это с помощью HtmlAgilityPack, пожалуйста?

Ответ №1:

        private List<string> ExtractAllAHrefTags(HtmlAgilityPack.HtmlDocument htmlSnippet)
            {
                List<string> hrefTags = new List<string>();
    
                foreach (HtmlNode link in htmlSnippet.DocumentNode.SelectNodes("//a[@href]"))
                {
                    HtmlAttribute att = link.Attributes["href"];
                    hrefTags.Add(att.Value);
                }
    
                return hrefTags;
            }

foreach (var item in hrefTags)
            {
                if(item.IndexOf(@"/bbs/cmoic/")>-1)
                {
                    if (!epilist1.Contains(item))
                    {
                        epilist1.Add(site1   item);
                    }
                }
            }
  

Это сработало.