#javascript #web #web-scraping
#javascript #веб #очистка веб-страниц
Вопрос:
Я хочу создать сайт (с использованием HTML, CSS и Javascript), который будет очищать данные с других сайтов. Я хочу использовать javascript для достижения этой цели. Какой лучший способ это сделать? Я хотел бы избежать использования Node.js или какой-либо другой платформы.
Ответ №1:
Если вы получаете ошибку cors, просто используйте cors где угодно.
Для синтаксического анализа dom используйте DOMParser
Пример:
fetch(`https://cors-anywhere.herokuapp.com/${url}`)
.then(response => response.text())
.then(html => {
const parser = new DOMParser()
const dom = parser.parseFromString(htmlContent, 'text/html')
// now you can select elements like for normal node
dom.querySelector('div')
})
У вас есть какие-либо другие проблемы?
Комментарии:
1. Конрад, спасибо за ответ. Итак, вы против Node.js использование для этой цели?
2. Я не против. Но хостинг node.js сервер не так прост, как хостинг веб-страницы.