Использование rvest для извлечения нескольких таблиц на странице

#r #rvest

#r #rvest

Вопрос:

Как мне преобразовать все списки в фрейм данных, добавить все фреймы данных и экспортировать в csv?

 library(rvest)

webpage <- read_html("https://www.sec.gov/Archives/edgar/data/21665/000144530512000409/exhibit21.htm")

tbls <- html_nodes(webpage, "table")
tbls_ls <- html_table(tbls,fill = TRUE)

colnames(tbls_ls[[1]]) <- c("Name", "Country")
 

Ответ №1:

Вы можете получить все таблицы по ссылке и связать их вместе, используя bind_rows

 library(rvest)
library(dplyr)

url <- "https://www.sec.gov/Archives/edgar/data/21665/000144530512000409/exhibit21.htm"

url %>%
  read_html() %>%
  html_table() %>%
  bind_rows()
 

Однако для этого потребуется небольшая очистка и последующее переименование, поскольку он не идентифицирует имена столбцов отдельно.