#r #twitter #tweets #rtweet
#r #Twitter #твиты #rtweet
Вопрос:
Недавно я использовал функцию search_fullarchive в пакете rtweet для чтения большого количества твитов (~ 500 000). Поскольку файл очень большой, и мне нужно было перенести данные на другой компьютер, я сохранил файл в формате rds, который оказался меньше по размеру. Я использовал следующую функцию в базе R для чтения в файле:
tweet<-readRDS("20201211164534-1.rds")
Однако вместо набора данных я получил объект, который показан на изображении ниже
typeof(tweet)
[1]"list"
Я открыл каждый узел, но не могу найти набор данных. У кого-нибудь есть идея, если / где я могу найти набор данных с моими твитами в файле rds? Спасибо!
Обновление: кто-то спросил о функции, которую я использовал для сохранения набора данных твитов. Я не использовал функцию, но r автоматически сохранял файлы rds в моем каталоге, когда я запускал функцию search_fullarchive, как показано ниже:
fever.june.1<-search_fullarchive(
fever,#Search query on which to match/filter tweets
n = 500000, #Number of tweets to return; it is best to set this number in intervals of 100 for the '30day' API and either 100 (for sandbox) or 500 (for paid) for the 'fullarchive' API. Default is 100.
fromDate = 202006010000, #Oldest date-time (YYYYMMDDHHMM)
toDate = 202006302359,#Newest date-time (YYYYMMDDHHMM)
env_name = "develop",#Name/label of developer environment to use for the search.
#safedir = "~/Desktop/",#Name of directory to which each response object should be saved.
parse = TRUE,#Logical indicating whether to convert data into data frame.
token = token #A token associated with a user-created APP
)
Комментарии:
1. Какой код вы использовали для создания RDS в первую очередь? У вас был
httr
rvest
объект или? Похоже, что твиты находятся вcontent
, но они просто закодированы в необработанном виде.2. Спасибо за комментарий! Я не использовал никакого кода для его сохранения. RDS автоматически сохраняется в моем каталоге, но размер файлов кажется правильным
3. Я не уверен, что понимаю, как это возможно. Файлы RDS обычно не сохраняются автоматически.
4. Я добавил код, который я запустил для получения твитов. Я считаю, что это не каждая функция, но, может быть, эта функция? Дайте мне знать, что вы думаете
5. Согласно документации, эта функция вернет tibble . Единственная ссылка на файлы RDS в этом пакете — это функция «прокрутки» для обработки запросов на выгрузку. Вы можете попробовать следовать приведенным здесь советам, чтобы открыть эти временные файлы github.com/ropensci/rtweet/issues/388 . Хотя лучшей практикой было бы явно сохранить нужные вам данные самостоятельно с помощью чего-то вроде
saveRDS("fever.june.1", "fever.rds")