#r #dataframe #gis #spatial #sf
#r #фрейм данных #гис #пространственный #sf
Вопрос:
Предполагая, что у меня есть два sf
объекта с одинаковой системой отсчета координат и неперекрывающейся областью, как правильно объединить эти два sf
объекта для создания одного sf
объекта?
Вот пример.
# Load packages
library(tidyverse)
library(sf)
# Load the example sf object
nc <- st_read(system.file("shape/nc.shp", package="sf"))
# print the first three rows of nc in the console
head(nc, 3)
# Simple feature collection with 3 features and 14 fields
# geometry type: MULTIPOLYGON
# dimension: XY
# bbox: xmin: -81.74107 ymin: 36.23388 xmax: -80.43531 ymax: 36.58965
# epsg (SRID): 4267
# proj4string: proj=longlat datum=NAD27 no_defs
# AREA PERIMETER CNTY_ CNTY_ID NAME FIPS FIPSNO CRESS_ID BIR74 SID74 NWBIR74 BIR79 SID79 NWBIR79 geometry
# 1 0.114 1.442 1825 1825 Ashe 37009 37009 5 1091 1 10 1364 0 19 MULTIPOLYGON (((-81.47276 3...
# 2 0.061 1.231 1827 1827 Alleghany 37005 37005 3 487 0 10 542 3 12 MULTIPOLYGON (((-81.23989 3...
# 3 0.143 1.630 1828 1828 Surry 37171 37171 86 3188 5 208 3616 6 260 MULTIPOLYGON (((-80.45634 3...
nc
Это sf
объект, а также фрейм данных. Большинство функций из dplyr
или tidyverse
хорошо работают на sf
объекте. Ниже я использовал slice
функцию для разделения nc
объекта на nc1
и nc2
.
# Split the nc object to two sf objects
nc1 <- nc %>% slice(1:50)
nc2 <- nc %>% slice(51:100)
# Print the crs of nc, nc1, and nc2
st_crs(nc)
# Coordinate Reference System:
# EPSG: 4267
# proj4string: " proj=longlat datum=NAD27 no_defs"
st_crs(nc1)
# Coordinate Reference System:
# EPSG: 4267
# proj4string: " proj=longlat datum=NAD27 no_defs"
st_crs(nc2)
# Coordinate Reference System:
# EPSG: 4267
# proj4string: " proj=longlat datum=NAD27 no_defs"
Как вы можете видеть, nc
, nc1
и nc2
все имеют одинаковую систему координат, и между nc1
и nc2
нет перекрывающихся областей.
Поскольку sf
объекты являются data frames
, моя первая мысль объединить два data frames
— использовать bind_rows
из dplyr
пакета. Однако bind_rows
выдал мне предупреждение.
# Combine nc1 and nc2 with bind_rows
nc_combine <- bind_rows(nc1, nc2)
# Warning messages:
# 1: In bind_rows_(x, .id) :
# Vectorizing 'sfc_MULTIPOLYGON' elements may not preserve their attributes
# 2: In bind_rows_(x, .id) :
# Vectorizing 'sfc_MULTIPOLYGON' elements may not preserve their attributes
Новый объект nc_combine
по-прежнему является sf
объектом data frame
с тем же номером строки и столбца, что и nc
. Однако я не могу получить доступ к какой-либо информации в nc_combine
, и информация о координатах, похоже, исчезла.
class(nc_combine)
# [1] "sf" "data.frame"
dim(nc_combine)
# [1] 100 15
nc_combine
# Error in .subset2(x, i, exact = exact) :
# attempt to select less than one element in get1index
Другими словами, мой вопрос заключается в том, как объединить nc1
и nc2
воссоздать nc
объект?
Ответ №1:
Есть такая rbind
функция, которая была в R с оооо 1990 года-что-то вроде:
> rbind(nc1,nc2)
Simple feature collection with 100 features and 14 fields
geometry type: MULTIPOLYGON
dimension: XY
bbox: xmin: -84.32385 ymin: 33.88199 xmax: -75.45698 ymax: 36.58965
epsg (SRID): 4267
proj4string: proj=longlat datum=NAD27 no_defs
First 10 features:
[etc]
Я не знаю, почему bind_rows
не работает.
Комментарии:
1. Да, мне следовало сначала протестировать rbind. Спасибо.