#import #google-sheets
#импорт #google-таблицы
Вопрос:
Я ищу решение в электронной таблице Google, чтобы проверить, есть ли у домена какой-либо контент на его сайте или показывает пустую страницу / выдает ошибку 404.
Я ищу способ получить два разных результата (1 и 0) в соответствии с этими требованиями:
- 1 если домен существует и в этом домене есть содержимое
- 0, если домен не существует
- 0, если домен существует, но не может быть достигнут (404)
- 0, если домен существует и может быть доступен, но имеет пустую страницу
Примеры приведены в следующей таблице: https://docs.google.com/spreadsheets/d/1gcdF_NdhYX4vBJgwP-cAVsTmeO2WgrynND2f63Zi3Lk/edit#gid=0
Я пытался получить некоторую дату из доменов с помощью IMPORTDATA, IMPORTHTML и IMPORTXML (в качестве следующего шага я бы добавил еще один столбец, который дает мне 1, если содержимое не является ячейкой, не является пустым, 0 еще:
=if(isna(IMPORTDATA(A1))=FALSE;1;0)
=if(isna(importhtml(A9;»список»;1));»»;транспонировать(ImportHTML(A9;»список»;1)))
=IMPORTXML(A13;»//h:h1″)
Но эти формулы недостаточно надежны для решения этой задачи. Я был бы большим поклонником IMPORTXML, но, как я уже прочитал, в настоящее время он не работает в новых электронных таблицах Google (даже официальные примеры не работают для меня …).
Есть ли какой-либо способ решить эту проблему примерно для 1000 доменов? Заранее спасибо!
Ответ №1:
Вы можете попробовать создать сценарий в редакторе сценариев:
function SOverflowChecker( uri )
{
var response_code ;
try {
response_code = UrlFetchApp .fetch( uri ) .getResponseCode() .toString() ;
}
catch( error ) {
response_code = error .toString() .match( / returned code (ddd)./ )[1] ;
}
finally {
return response_code ;
}
}
Сохраните его, затем в ячейке используйте этот код:
=SOverflowChecker(RowValueOfURL)
RowValueOfURL — строка для любого вашего URL-адреса.
Так, например, если URL-адрес находится в B2:
=SOverflowChecker(B2)
Он проверит веб-сайт и вернет код состояния, на основе кода состояния вы можете оценить, является ли URL-адрес мертвым или живым.
Ссылка: http://www.tinkeredge.com/blog/web-usability/check-on-page-for-broken-links-with-google-docs /
Надеюсь, это поможет