Очистка веб-страниц с использованием javascript

#javascript #web #web-scraping

#javascript #веб #очистка веб-страниц

Вопрос:

Я хочу создать сайт (с использованием HTML, CSS и Javascript), который будет очищать данные с других сайтов. Я хочу использовать javascript для достижения этой цели. Какой лучший способ это сделать? Я хотел бы избежать использования Node.js или какой-либо другой платформы.

Ответ №1:

Если вы получаете ошибку cors, просто используйте cors где угодно.

Для синтаксического анализа dom используйте DOMParser

Пример:

 fetch(`https://cors-anywhere.herokuapp.com/${url}`)
.then(response => response.text())
.then(html => {
  const parser = new DOMParser()
  const dom = parser.parseFromString(htmlContent, 'text/html')
  // now you can select elements like for normal node
  dom.querySelector('div')
})
  

У вас есть какие-либо другие проблемы?

Комментарии:

1. Конрад, спасибо за ответ. Итак, вы против Node.js использование для этой цели?

2. Я не против. Но хостинг node.js сервер не так прост, как хостинг веб-страницы.