Извлечение данных

#jquery

#jquery

Вопрос:

поскольку я играл с некоторыми nodejs и express, у меня возникли некоторые проблемы.

У меня есть некоторые доступные HTML-файлы, и я хочу извлечь некоторые данные в массив. Я могу извлечь некоторые базовые вещи, но некоторые более подробные данные, которые я получил, с трудом решают эту проблему.

Вот моя html-часть:

 <hr>
<h1>Topic</h1>
written byamp;nbsp;<font color=#ffffff>sCHween</font>amp;nbsp;amp;nbsp;amamp;nbsp;18.06.2014amp;nbsp;atamp;nbsp;21:26:15
<hr>
This is my test to extract some data!
<hr>
  

и вот как я думаю, я мог бы

 jsdom.env({
html: body,
scripts: ['http://code.jquery.com/jquery-2.1.1.min.js'],
done: function(errors, window) {
var $ = window.jQuery;
$body = $(iconv.decode(new Buffer(body), "ISO-8859-1")),

self.items[0] ={
  topic: $body.find('h1:eq(1)').text(),
  author: $body.find('font[color=#ffffff]').first().text(),
  date: {should be 18.06.204},
  time: {should be 21.26.15},
  text: $body.find('hr:eq(1)').nextSibling
}

console.log(self.items);
res.end('');
}
  

Мои вопросы:

Я понятия не имею, как я могу приблизиться к дате и времени? Как я могу вывести текст между двумя тегами hr?

Для меня я не ожидаю готового решения — я бы еще больше предпочел, если бы вы могли дать мне несколько идей, как я могу достичь своих целей.

Большое спасибо и хорошего дня, sCHween

Ответ №1:

 <hr>
<h1>Topic</h1>
<b>written byamp;nbsp;<font color=#ffffff>sCHween</font>amp;nbsp;amp;nbsp;amamp;nbsp;18.06.2014amp;nbsp;atamp;nbsp;21:26:15</b>
<hr>
<i>This is my test to extract some data!</i>
<hr>
<p></p> 
  

имеют функции, которые четко не определены.
должно быть что-то вроде моего примера

    var topic= $('h1:eq(0)').text(),
      author= $('font[color=#ffffff]').first().text(),
      text= $('i:eq(0)').text(),
      date=$('b').text().match(/(d )/g);
    var myArray = [ topic, author, text ];
    console.log( myArray);
  

Комментарии:

1. Спасибо за ваш отзыв. Поиграл с JSFiddle, и это сработало. После этого я изменил свой код следующим образом, и результат таков: ,9iFab,. Я пропустил что-то важное?