#r #r-package
#r #r-package
Вопрос:
Я сохраняю два списка как «.RData» в my_package/data и храню их документацию в /R. Но после установки я не могу загрузить эти два списка, но он показывает справочную документацию. Возможно ли экспортировать список в пакете R? Или просто возможность матрицы или что-то в этом роде. Меня смущает «один объект в одном.Файл Rdata»
Комментарии:
1. Базовый
datasets
пакет полон разрозненных классов объектов, включаяAirPassengers
иco2
(вектор временных рядов) иislands
(именованный вектор). вы можете увидеть, как они установлены в этом пакете, просмотрев исходный код, любезно предоставленный wch по адресу github.com/wch/r-source/tree/trunk/src/library/datasets .2. Понятно.
.Rdata
файлы бесполезны в контексте создания пакетов. Вы видели R-пакеты Хэдли?
Ответ №1:
Онлайн-книга Хэдли «Пакеты R» (и особенно глава о данных) более подробно описывает, как включать данные, но я расскажу, как сделать произвольные объекты полезными в пакете.
Заранее:
- у одного есть личные данные (доступные для функций одного и того же пакета без изменений, доступные за пределами пакета с использованием
:::
) и общедоступные данные (данные, доступные как для внутренних функций, так и для тех, кто загружает пакет, при необходимости с отложенной загрузкой) - общедоступные данные хранятся в
./mypackage/data/
каталоге, и они должны использовать*.rda
расширение (*.Rdata
), не работает; общепринятое соглашение (для контроля версий, удобства, удобства обслуживания), хотя и не является строгим требованием, касается одного объекта для каждого.rda
файла и названо как имя объекта; ниже я сохранилmypubliclist
в./mypackage/data/mypubliclist.rda
; - все личные данные должны быть сохранены в одном файле,
./mypackage/R/sysdata.rda
.
Вот пример пакета (я использую devtools
, но есть и другие способы сделать это):
devtools::create("~/StackOverflow/14489611/mypackage")
# v Creating 'C:/Users/r2/StackOverflow/14489611/mypackage/'
# v Setting active project to 'C:/Users/r2/StackOverflow/14489611/mypackage'
# v Creating 'R/'
# v Writing 'DESCRIPTION'
# Package: mypackage
# Title: What the Package Does (One Line, Title Case)
# Version: 0.0.0.9000
# Authors@R (parsed):
# * First Last <first.last@example.com> [aut, cre] (YOUR-ORCID-ID)
# Description: What the package does (one paragraph).
# License: `use_mit_license()`, `use_gpl3_license()` or friends to pick a
# license
# Encoding: UTF-8
# LazyData: true
# Roxygen: list(markdown = TRUE)
# RoxygenNote: 7.1.1
# v Writing 'NAMESPACE'
# v Changing working directory to 'C:/Users/r2/StackOverflow/14489611/mypackage/'
Я написал небольшой скрипт ./data-raw/mylist.R
для создания некоторых случайных данных. Этот файл предназначен только для воспроизводимости, на него не ссылаются во время создания или загрузки пакета.
set.seed(42) # R-4.0.2
myprivatelist <- list(a = sample.int(10), b = sample.int(1e5))
mypubliclist <- list(a=1:10, b=11:20)
save(mypubliclist, file="~/StackOverflow/14489611/mypackage/data/mypubliclist.rda")
save(myprivatelist, file="~/StackOverflow/14489611/mypackage/R/sysdata.rda")
Я также создал файл R ./mypackage/R/data.R
(вы можете назвать этот файл как угодно, но он должен быть ниже ./mypackage/R
), чтобы содержать простую документацию для этих списков:
#' My private list
#' @format list with random numbers
"myprivatelist"
#' My public list
#' @format list with not-so-random numbers
"mypubliclist"
А теперь создайте документацию:
devtools::document("C:/Users/r2/StackOverflow/14489611/mypackage")
# Updating mypackage documentation
# Loading mypackage
# Writing myprivatelist.Rd
# Writing mypubliclist.Rd
Я создам пакет, перезапущу R, установлю и затем загружу наборы данных.
devtools::build("~/StackOverflow/14489611/mypackage")
# v checking for file 'C:Usersr2StackOverflow14489611mypackage/DESCRIPTION'
# - preparing 'mypackage':
# v checking DESCRIPTION meta-information
# - checking for LF line-endings in source and make files and shell scripts
# - checking for empty or unneeded directories
# NB: this package now depends on R (>= 3.5.0)
# WARNING: Added dependency on R >= 3.5.0 because serialized objects in serialize/load version 3 cannot be read in older versions of R. File(s) containing such objects: 'mypackage/R/sysdata.rda' 'mypackage/data/mypubliclist.rda'
# - building 'mypackage_0.0.0.9000.tar.gz'
#
# [1] "C:/Users/r2/StackOverflow/14489611/mypackage_0.0.0.9000.tar.gz"
## restart R
install.packages("C:/Users/r2/StackOverflow/14489611/mypackage_0.0.0.9000.tar.gz")
# Installing package into 'C:/Users/r2/R/win-library/4.0'
# (as 'lib' is unspecified)
# inferring 'repos = NULL' from 'pkgs'
# * installing *source* package 'mypackage' ...
# ** using staged installation
# ** R
# ** data
# *** moving datasets to lazyload DB
# ** byte-compile and prepare package for lazy loading
# ** help
# *** installing help indices
# converting help for package 'mypackage'
# finding HTML links ... done
# myprivatelist html
# mypubliclist html
# ** building package indices
# ** testing if installed package can be loaded from temporary location
# *** arch - i386
# *** arch - x64
# ** testing if installed package can be loaded from final location
# *** arch - i386
# *** arch - x64
# ** testing if installed package keeps a record of temporary installation path
# * DONE (mypackage)
И давайте посмотрим, что сработало:
str(mypubliclist)
# Error in str(mypubliclist) : object 'mypubliclist' not found
# x
# 1. -utils::str(mypubliclist)
library(mypackage)
str(mypubliclist)
# List of 2
# $ a: int [1:10] 1 2 3 4 5 6 7 8 9 10
# $ b: int [1:10] 11 12 13 14 15 16 17 18 19 20
str(myprivatelist)
# Error in str(myprivatelist) : object 'myprivatelist' not found
# x
# 1. -utils::str(myprivatelist)
str(mypackage:::myprivatelist)
# List of 2
# $ a: int [1:10] 1 5 10 8 2 4 6 9 7 3
# $ b: int [1:100000] 47128 16740 61605 73236 9091 62041 33700 59359 54789 54586 ...
И его документация, если вам интересно. (Я использую print
, потому что в противном случае он появится на другой панели; это просто сбрасывает его на консоль.)
print(help("mypubliclist"))
# mypubliclist package:mypackage R Documentation
# My public list
# Description:
# My public list
# Usage:
# mypubliclist
#
# Format:
# list with not-so-random numbers
print(help("myprivatelist"))
# myprivatelist package:mypackage R Documentation
# My private list
# Description:
# My private list
# Usage:
# myprivatelist
#
# Format:
# list with random numbers
Комментарии:
1. да! это работает! просто измените .Rdata на .rda, и все готово. Большое спасибо!
2. Есть ли способ включить такой список без «упаковки» его в
.rda
файл? Это кажется немного окольным путем.3. Из раздела 1.1.6 » Написание расширений R » Данные: файлы данных могут иметь один из трех типов, как указано в их расширении: обычный код R (
.R
или.r
), таблицы (.tab
,.txt
или.csv
, см.?data
Форматы файлов, и обратите внимание, что.csv
это не стандартный формат CSV) илиsave()
изображения (.RData
или.rda
). @RoyalTS4. Означает ли это, что вы могли бы просто поместить первые три строки
./data-raw/mylist.R
в.R
файл и добавить их в качестве данных?5. TBH, я никогда не пробовал (и у меня нет причин) использовать
.R
файлы внутри./data/
, когда я скопировал это и опубликовал в качестве комментария, я был немного удивлен. Отчасти мне любопытно посмотреть, как это работает, это, безусловно, кажется (мне) необычным среди пакетов, которые я использую. Извините, у меня нет личного опыта работы с этим методом.