R — очистка хэштега Instagram

#r #json #instagram

#r #json #Instagram

Вопрос:

Я пытаюсь получить доступ к информации о хэштегах post и связанных с ними. Я пытаюсь преобразовать json в R, используя следующее

 library(jsonlite)

hashtag <- "sponsored"
url_start <- str_glue("http://instagram.com/explore/tags/{hashtag}/?__a=1")
json <- fromJSON(url_start)

 

Я получаю эту ошибку

 Error in parse_con(txt, bigint_as_char) : 
  lexical error: invalid char in json text.
                                       <!DOCTYPE html> <html lang="en"
                     (right here) ------^
 

Я могу что-то получить, если использую одного пользователя, например, мое собственное имя пользователя вместо {hashtag} . Глядя на #, я просто не могу заставить его работать. В настоящее время я думаю, что это проблема Instagram, когда они блокируют запрос?

Ответ №1:

На самом деле, если вы запустите httr::GET(url_start) , вы увидите, что вас блокируют при попытке входа в систему.

Instagram поместил ваш IP-адрес в список блокировки.

Не спамьте, просто сделайте что-нибудь еще и подождите 2-3 дня, и, надеюсь, блокировка будет отменена.

Как только код снова начнет работать, обязательно добавьте Sys.sleep(sample(4:20,1)) его перед запуском json <- fromJSON(url_start)