#node.js #scrape #jsdom
Вопрос:
html-изображение с помощью JsDom как я могу извлечь содержимое между разрывами страниц? Хотите получить все содержимое между ними…
Комментарии:
1. Пожалуйста, предоставьте достаточно кода, чтобы другие могли лучше понять или воспроизвести проблему.
Ответ №1:
Вы можете использовать регулярное выражение для передачи содержимого между тегами, например:
const dom = new JSDOM(``, { url: "https://example.org/", referrer: "https://example.com/", contentType: "text/html", includeNodeLocations: true, storageQuota: 10000000 }); var bodyhtml = dom.window.document.body.innerHTML; const regexp = /lt;span epub:type="pagebreak" . gt;lt;/spangt;(.*)lt;pgt;. lt;/spangt;/gms; var content = bodyhtml.matchAll(regexp); console.log([...content]);