#xpath #google-sheets #seo
#xpath #google-sheets #seo
Вопрос:
Я пытаюсь использовать Xpath для извлечения метаописаний с веб-страниц, используя Google Sheets.
У меня есть эта работа для извлечения заголовков: =importXml(www.example.com; "//title")
Вот два источника моего обучения:
http://seogadget.co.uk/playing-around-with-importxml-in-google-spreadsheets/
http://docs.google.com/support/bin/answer.py?hl=enamp;answer=75507
Я прочитал много других сообщений на этом сайте, и, похоже, это похожая идея того, чего я хочу:
"/html/head/meta[@name='description']/@content"
"/*/head/meta[@name='description']/@content"
"//head/meta[@name="description"]/@content"
Ни одно из них не работает в Google Sheets, который указывает, чтобы записать его в Xpath. Единственное отличие заключается в том, что в Google Sheets вы должны использовать «вместо» (отсюда и такое описание). Я честно пробовал это около 219 разных ways….no удачи.
Есть идеи? Заранее спасибо!
Комментарии:
1. Иногда проблема может быть связана с апостроф (’), кавычки одинарные (‘x’) или двойные («x») (также известные как кавычки, речевые знаки, кавычки), локализация электронной таблицы и синтаксис формулы, смотрите разницу
"/*/head/meta[@name='description']/@content"
с'/*/head/meta[@name="description"]/@content'
, если вы используете это в формуле, обычно я всегда тестирую не в формуле, а в отдельной ячейке (чтобы избежать ошибок).
Ответ №1:
//meta[@name='description']/@content
Таким образом, ваш полный вызов URL в Google sheet будет
=importxml(A1,"//meta[@name='description']/@content")
Я создал несколько потрясающих инструментов SEO с использованием ImportXML — это только начало, приятель! 🙂