C # Получение значений из html

#c# #html-agility-pack

#c# #html-agility-pack

Вопрос:

У меня есть этот html

      <a class="video" style="display: block" href="some text">
                            <img class="pic" src="" alt="">
                            <div class="title">some text</div>
                    </a>
    
    <a class="video" style="display: block" href="some text">
                            <img class="pic" src="" alt="">
                            <div class="title">some text</div>
                    </a>
 

Он падает несколько раз. Как я могу получить значения href и заголовки?

Я пробовал это, но я не мог понять, как получить <div class="title">

 foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//a[@class='video']")) 
{ 
Console.WriteLine("node:"   node.GetAttributeValue("href", null));
}
 

Комментарии:

1. вы уже что- нибудь пробовали ?

2. я пробовал это, но я не мог понять, как получить <div class=»title»> foreach (HtmlNode узел в документе. DocumentNode. SelectNodes(«//a[@class=’video’]»)) { Консоль. WriteLine(«узел:» узел. GetAttributeValue(«href», null));

3. Что вы подразумеваете под «это происходит несколько раз»? Вы имеете в виду, что вы повторили один и тот же блок кода несколько раз?

Ответ №1:

Посмотрите, работает ли это для вас.

 foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//a[@class='video']")) 
{ 
    Console.WriteLine("href: "   node.GetAttributeValue("href", null));
    Console.WriteLine("title: "   node.SelectSingleNode("./div[@class='title']").InnerText);
}