Как я могу извлечь содержимое между этими двумя разрывами страниц с помощью JSDOM Nodejs?

#node.js #scrape #jsdom

Вопрос:

html-изображение с помощью JsDom как я могу извлечь содержимое между разрывами страниц? Хотите получить все содержимое между ними…

Комментарии:

1. Пожалуйста, предоставьте достаточно кода, чтобы другие могли лучше понять или воспроизвести проблему.

Ответ №1:

Вы можете использовать регулярное выражение для передачи содержимого между тегами, например:

 const dom = new JSDOM(``, {  url: "https://example.org/",  referrer: "https://example.com/",  contentType: "text/html",  includeNodeLocations: true,  storageQuota: 10000000 });  var bodyhtml = dom.window.document.body.innerHTML;  const regexp = /lt;span epub:type="pagebreak" . gt;lt;/spangt;(.*)lt;pgt;. lt;/spangt;/gms; var content = bodyhtml.matchAll(regexp); console.log([...content]);