Скрапи, как извлечь только родительский ли, кроме дочернего ли

#python #html #css #scrapy

Вопрос:

Я пытаюсь просканировать сайт[URL : https://www.khaasfood.com/shop/] Сначала я обнаружил, что мне нужно получить категории с иерархией.

.контейнер содержит список тегов li, который является родительской категорией.

У каждой родительской категории может быть детский тег li.

Сначала я должен выбрать родительские категории. но как? «‘response.css(‘.container li .cat-item’) «‘ этот код возвращает все теги li, что означает категорию родителей и детей бота.

Ответ №1:

.container > li.cat-item будут выбраны только теги li, которые являются дочерними элементами .container элемента

.container li.cat-item css селектор без > будет выбирать все li теги-потомки