#javascript #r #web-scraping #rvest #scrape
#javascript #r #очистка веб-страниц #rvest #очистить
Вопрос:
Я хотел бы очистить таблицу по следующей ссылке: https://www.fangraphs.com/dailyprojections.aspx?pos=allamp;stats=batamp;type=sabersimamp;team=0amp;lg=allamp;players=0amp;sort=18,d
Я могу получить результаты, используя пакет rvest, но только первые 30, которые отображаются на первой странице. Как я могу изменить раскрывающийся список «размер страницы» на увеличение до 1000, чтобы я мог получить все результаты?
Это код, который я пробовал до сих пор, но я предполагаю, что это не HTML-таблица, поэтому потребуется использовать другой метод.
library(rvest)
url <- "https://www.fangraphs.com/dailyprojections.aspx?pos=allamp;stats=batamp;type=sabersim"
url1 <- url
pgsession <- html_session(url1)
pgform <- html_form(pgsession)[[1]]
filled_form <-set_values(pgform, "DFSBoard1$dg1$ctl00$ctl02$ctl00$PageSizeComboBox" = "1000")
a <- submit_form(session = pgsession, form=filled_form)
get_table <- a %>%
html_nodes("table") %>%
.[[4]] %>%
html_table(header=TRUE)
Комментарии:
1. Пожалуйста, записывайте вызовы функций по мере их появления. Вы уверены, что
Html_table
существует вrvest
? R чувствителен к регистру.2. да, html_table существует. Извините за опечатку