Как добавить список к экспортируемым данным при создании пакетов R?

#r #r-package

#r #r-package

Вопрос:

Я сохраняю два списка как «.RData» в my_package/data и храню их документацию в /R. Но после установки я не могу загрузить эти два списка, но он показывает справочную документацию. Возможно ли экспортировать список в пакете R? Или просто возможность матрицы или что-то в этом роде. Меня смущает «один объект в одном.Файл Rdata»

Комментарии:

1. Базовый datasets пакет полон разрозненных классов объектов, включая AirPassengers и co2 (вектор временных рядов) и islands (именованный вектор). вы можете увидеть, как они установлены в этом пакете, просмотрев исходный код, любезно предоставленный wch по адресу github.com/wch/r-source/tree/trunk/src/library/datasets .

2. Понятно. .Rdata файлы бесполезны в контексте создания пакетов. Вы видели R-пакеты Хэдли?

Ответ №1:

Онлайн-книга Хэдли «Пакеты R» (и особенно глава о данных) более подробно описывает, как включать данные, но я расскажу, как сделать произвольные объекты полезными в пакете.

Заранее:

  • у одного есть личные данные (доступные для функций одного и того же пакета без изменений, доступные за пределами пакета с использованием ::: ) и общедоступные данные (данные, доступные как для внутренних функций, так и для тех, кто загружает пакет, при необходимости с отложенной загрузкой)
  • общедоступные данные хранятся в ./mypackage/data/ каталоге, и они должны использовать *.rda расширение ( *.Rdata ), не работает; общепринятое соглашение (для контроля версий, удобства, удобства обслуживания), хотя и не является строгим требованием, касается одного объекта для каждого .rda файла и названо как имя объекта; ниже я сохранил mypubliclist в ./mypackage/data/mypubliclist.rda ;
  • все личные данные должны быть сохранены в одном файле, ./mypackage/R/sysdata.rda .

Вот пример пакета (я использую devtools , но есть и другие способы сделать это):

 devtools::create("~/StackOverflow/14489611/mypackage")
# v Creating 'C:/Users/r2/StackOverflow/14489611/mypackage/'
# v Setting active project to 'C:/Users/r2/StackOverflow/14489611/mypackage'
# v Creating 'R/'
# v Writing 'DESCRIPTION'
# Package: mypackage
# Title: What the Package Does (One Line, Title Case)
# Version: 0.0.0.9000
# Authors@R (parsed):
#     * First Last <first.last@example.com> [aut, cre] (YOUR-ORCID-ID)
# Description: What the package does (one paragraph).
# License: `use_mit_license()`, `use_gpl3_license()` or friends to pick a
#     license
# Encoding: UTF-8
# LazyData: true
# Roxygen: list(markdown = TRUE)
# RoxygenNote: 7.1.1
# v Writing 'NAMESPACE'
# v Changing working directory to 'C:/Users/r2/StackOverflow/14489611/mypackage/'
  

Я написал небольшой скрипт ./data-raw/mylist.R для создания некоторых случайных данных. Этот файл предназначен только для воспроизводимости, на него не ссылаются во время создания или загрузки пакета.

 set.seed(42) # R-4.0.2
myprivatelist <- list(a = sample.int(10), b = sample.int(1e5))
mypubliclist <- list(a=1:10, b=11:20)
save(mypubliclist, file="~/StackOverflow/14489611/mypackage/data/mypubliclist.rda")
save(myprivatelist, file="~/StackOverflow/14489611/mypackage/R/sysdata.rda")
  

Я также создал файл R ./mypackage/R/data.R (вы можете назвать этот файл как угодно, но он должен быть ниже ./mypackage/R ), чтобы содержать простую документацию для этих списков:

 #' My private list
#' @format list with random numbers
"myprivatelist"

#' My public list
#' @format list with not-so-random numbers
"mypubliclist"
  

А теперь создайте документацию:

 devtools::document("C:/Users/r2/StackOverflow/14489611/mypackage")
# Updating mypackage documentation
# Loading mypackage
# Writing myprivatelist.Rd
# Writing mypubliclist.Rd
  

Я создам пакет, перезапущу R, установлю и затем загружу наборы данных.

 devtools::build("~/StackOverflow/14489611/mypackage")
# v  checking for file 'C:Usersr2StackOverflow14489611mypackage/DESCRIPTION'
# -  preparing 'mypackage':
# v  checking DESCRIPTION meta-information
# -  checking for LF line-endings in source and make files and shell scripts
# -  checking for empty or unneeded directories
#      NB: this package now depends on R (>= 3.5.0)
#      WARNING: Added dependency on R >= 3.5.0 because serialized objects in  serialize/load version 3 cannot be read in older versions of R.  File(s) containing such objects: 'mypackage/R/sysdata.rda'  'mypackage/data/mypubliclist.rda'
# -  building 'mypackage_0.0.0.9000.tar.gz'
#    
# [1] "C:/Users/r2/StackOverflow/14489611/mypackage_0.0.0.9000.tar.gz"

## restart R
install.packages("C:/Users/r2/StackOverflow/14489611/mypackage_0.0.0.9000.tar.gz")
# Installing package into 'C:/Users/r2/R/win-library/4.0'
# (as 'lib' is unspecified)
# inferring 'repos = NULL' from 'pkgs'
# * installing *source* package 'mypackage' ...
# ** using staged installation
# ** R
# ** data
# *** moving datasets to lazyload DB
# ** byte-compile and prepare package for lazy loading
# ** help
# *** installing help indices
#   converting help for package 'mypackage'
#     finding HTML links ... done
#     myprivatelist                           html  
#     mypubliclist                            html  
# ** building package indices
# ** testing if installed package can be loaded from temporary location
# *** arch - i386
# *** arch - x64
# ** testing if installed package can be loaded from final location
# *** arch - i386
# *** arch - x64
# ** testing if installed package keeps a record of temporary installation path
# * DONE (mypackage)
  

И давайте посмотрим, что сработало:

 str(mypubliclist)
# Error in str(mypubliclist) : object 'mypubliclist' not found
#     x
#  1. -utils::str(mypubliclist)
library(mypackage)
str(mypubliclist)
# List of 2
#  $ a: int [1:10] 1 2 3 4 5 6 7 8 9 10
#  $ b: int [1:10] 11 12 13 14 15 16 17 18 19 20
str(myprivatelist)
# Error in str(myprivatelist) : object 'myprivatelist' not found
#     x
#  1. -utils::str(myprivatelist)
str(mypackage:::myprivatelist)
# List of 2
#  $ a: int [1:10] 1 5 10 8 2 4 6 9 7 3
#  $ b: int [1:100000] 47128 16740 61605 73236 9091 62041 33700 59359 54789 54586 ...
  

И его документация, если вам интересно. (Я использую print , потому что в противном случае он появится на другой панели; это просто сбрасывает его на консоль.)

 print(help("mypubliclist"))
# mypubliclist             package:mypackage             R Documentation
# My public list
# Description:
#      My public list
# Usage:
#      mypubliclist
#      
# Format:
#      list with not-so-random numbers
print(help("myprivatelist"))
# myprivatelist            package:mypackage             R Documentation
# My private list
# Description:
#      My private list
# Usage:
#      myprivatelist
#      
# Format:
#      list with random numbers
  

Комментарии:

1. да! это работает! просто измените .Rdata на .rda, и все готово. Большое спасибо!

2. Есть ли способ включить такой список без «упаковки» его в .rda файл? Это кажется немного окольным путем.

3. Из раздела 1.1.6 » Написание расширений R » Данные: файлы данных могут иметь один из трех типов, как указано в их расширении: обычный код R ( .R или .r ), таблицы ( .tab , .txt или .csv , см. ?data Форматы файлов, и обратите внимание, что .csv это не стандартный формат CSV) или save() изображения ( .RData или .rda ). @RoyalTS

4. Означает ли это, что вы могли бы просто поместить первые три строки ./data-raw/mylist.R в .R файл и добавить их в качестве данных?

5. TBH, я никогда не пробовал (и у меня нет причин) использовать .R файлы внутри ./data/ , когда я скопировал это и опубликовал в качестве комментария, я был немного удивлен. Отчасти мне любопытно посмотреть, как это работает, это, безусловно, кажется (мне) необычным среди пакетов, которые я использую. Извините, у меня нет личного опыта работы с этим методом.