Я не могу проверить неработающие ссылки с помощью проверки неработающих ссылок на сайтах Google

#javascript #google-sites #urldecode #broken-links #link-checking

Вопрос:

Я использовал средство проверки неработающих ссылок Стивена Вачона для проверки неработающих ссылок на веб-сайте Google Сайтов. Вот код:

     const {SiteChecker} = require("broken-link-checker");

const siteChecker = new SiteChecker({
    excludeExternalLinks: false,
    excludeInternalLinks: false,
    filterLevel: 1,
    requestMethod: 'get', 
},

{
    "error": (error) => {
        console.error(error);
    },
    "end": () => {
        console.log ("THE SCAN IS DONE");
    },
    "link": (result) => {
        if(result.broken){
                console.log ("URL IS: "   `${result.url.original}`, 
                "LOCATION: "   `${result.base.original}`, "WITH TEXT: "   `${result.html.text}`);
            }
    }
});

siteChecker.enqueue("urlstringhere");
 

Это работает на обычных сайтах (я попробовал это на своем личном сайте http://davorpetreski.online), но это не будет работать на сайтах Google, потому что Google кодирует URL-адреса и перенаправляет. Например:

https://wakelet.com/wake/L0UVOgn6Hd_1Gsnju6oxN

на сайтах Google это

https://www.google.com/url?q=https://wakelet.com/wake/L0UVOgn6Hd_1Gsnju6oxNamp;sa=Damp;sntz=1amp;usg=AFQjCNHcpspNj_moWDExR_meisyPFxNEfg

Проверка ссылок проверяет вторую и говорит, что все в порядке (потому что это просто страница перенаправления), в то время как фактическая ссылка возвращает 404. Есть ли обходной путь для этого?

Есть ли другой инструмент/подход, который я должен использовать?