#r #rvest
#r #rvest
Вопрос:
Я пытаюсь удалить изображения с веб-сайта. Основываясь на отличной работе разработчиков пакета R, я получаю URL для изображения. Но я не могу загрузить желаемое изображение с помощью download.file(). Все, что я могу получить, — это бессмысленное изображение. Я искал в stackoverflow и думал, что проблема заключается в механизме защиты веб-сайта от обхода. Возможно, мне нужно установить ссылку для работы с scrape. Есть ли кто-нибудь, кто может предложить, как исправить эту проблему? Это меня очень беспокоило, заранее спасибо!
library(rvest)
library(RCurl)
library(XML)
library(httr)
library(stringr)
myheader <- c( "User-Agent" = "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) ", "Accept" = "text/html,application/xhtml xml,application/xml;q=0.9,*/*;q=0.8", "Accept-Language" = "en-us", "Connection" = "keep-alive", "Accept-Charset" = "GB2312,utf-8;q=0.7,*;q=0.7", "Referer" = "http://www.mm131.com")
url <- "http://www.mm131.com/mingxing/2016.html"
imgsrc <- html_session(url, add_headers(myheader))%>% html_node(".content-pic img") %>% html_attr('src')
download.file(imgsrc, "test.jpg", mode = "wb")