R — Web очистка объектов JavaScript с V8

#javascript #r #web-scraping #v8 #rvest

#javascript #r #веб-очистка #версия 8 #rvest

Вопрос:

У меня есть некоторый опыт работы с R, но я совершенно новичок в JavaScript. Недавно я пытаюсь очистить таблицу с этого веб-сайта (http://op1.win007.com/Oddslist/1599893.htm). Мне кажется, что веб-страница написана на JavaScript, и поэтому простой способ использования rvest для очистки не работает. Ниже приведен способ очистки нужной мне таблицы, если она находится в обычном HTML:

 library(rvest)
link <- "http://op1.win007.com/Oddslist/1599893.htm"
MyTable <- read_html(link) %>% html_nodes("oddsList_tab") %>% html_table(fill = TRUE)
  

Приведенный выше код выдает мне пустой список, который мне не нужен. Просмотрев другие сообщения и руководство по версии V8, я пришел к следующему:

 library(rvest)
library(V8)
link <- "http://op1.win007.com/Oddslist/1599893.htm"

MyText <- read_html(link) %>% html_nodes('script') %>% html_text()

ct <- v8()
html_nodes(MyText, "oddsList_tab") %>% html_text() %>% ct$eval()
  

Я понятия не имею, какая часть неверна, поскольку я новичок в JavaScript. Кроме того, я также хотел бы получить всплывающие таблицы, которые наводят курсор мыши на числа внутри таблиц. По-видимому, я понятия не имею, как это сделать, учитывая, что мне было трудно очистить таблицу на surface.

Я читал из других сообщений, что для этого может потребоваться заполнение некоторых переменных, но я понятия не имею, нужно ли мне это делать и как я могу это сделать.

Было бы здорово, если бы кто-нибудь мог показать мне, как это сделать, и, возможно, объяснить мне, как это работает.

Большое вам спасибо.

Комментарии:

1. Веб-ссылка на страницу больше не действительна.