#html #r #web-scraping #rvest
Вопрос:
Я пытаюсь очистить содержимое этой страницы https://fundf10.eastmoney.com/F10DataApi.aspx?type=lsjzamp;code=510300amp;page=1amp;sdate=2019-01-01amp;edate=2021-02-13amp;per=40 и до сих пор мне не везет. Я попробовал следующий код(ы), все безрезультатно, и все они возвращают одно и то же сообщение об ошибке (заголовок).
#1
css_selector <- "body > table"
fund_link %>% read_html() %>% html_element(css = css_selector) %>% html_table()
#2
fund_table <- fund_link %>%
html() %>%
html_nodes(xpath='/html/body/table') %>%
html_table()
#3
fund_table <- read_html(fund_link) %>%
html_node(".lsjz") %>%
html_table()
Господи, возьми клавиатуру…
Комментарии:
1. Ваш первый и третий отлично работают. Ваш второй отсутствует
read
, как вread_html
, вместо простоhtml
.