Извлечение определенных якорей из списка доменов в googlespreadsheets

#web-scraping #google-sheets #google-sheets-formula

#очистка веб-страниц #google-sheets #google-sheets-формула

Вопрос:

У меня есть большой список доменов, которые мне нужно проверить по разным параметрам. Один из них заключается в том, что мне нужно определить, содержат ли они определенные якоря:

  • казино
  • слоты
  • покер

Я использую следующую формулу: =IMPORTXML(A1,»//a/@href[содержит (., ‘казино’) или содержит (., ‘слоты’) или содержит (., ‘покер’)]»)

оказывается, он может очистить только URL-адрес, а не весь домен.

Был бы очень признателен за помощь в том, как очистить весь домен (все URL-адреса внутри одного домена), а не один URL.

https://docs.google.com/spreadsheets/d/1kgEEwjUKhdQowXV0fdJPALppyw5m2ZAefOYRrX-KFzg/edit?usp=sharing