Как объединить два sf-объекта с одинаковым разрешением и неперекрывающейся областью?

#r #dataframe #gis #spatial #sf

#r #фрейм данных #гис #пространственный #sf

Вопрос:

Предполагая, что у меня есть два sf объекта с одинаковой системой отсчета координат и неперекрывающейся областью, как правильно объединить эти два sf объекта для создания одного sf объекта?

Вот пример.

 # Load packages
library(tidyverse)
library(sf)

# Load the example sf object
nc <- st_read(system.file("shape/nc.shp", package="sf"))

# print the first three rows of nc in the console
head(nc, 3)
# Simple feature collection with 3 features and 14 fields
# geometry type:  MULTIPOLYGON
# dimension:      XY
# bbox:           xmin: -81.74107 ymin: 36.23388 xmax: -80.43531 ymax: 36.58965
# epsg (SRID):    4267
# proj4string:     proj=longlat  datum=NAD27  no_defs
#   AREA PERIMETER CNTY_ CNTY_ID      NAME  FIPS FIPSNO CRESS_ID BIR74 SID74 NWBIR74 BIR79 SID79 NWBIR79                       geometry
# 1 0.114     1.442  1825    1825      Ashe 37009  37009        5  1091     1      10  1364     0      19 MULTIPOLYGON (((-81.47276 3...
# 2 0.061     1.231  1827    1827 Alleghany 37005  37005        3   487     0      10   542     3      12 MULTIPOLYGON (((-81.23989 3...
# 3 0.143     1.630  1828    1828     Surry 37171  37171       86  3188     5     208  3616     6     260 MULTIPOLYGON (((-80.45634 3...
  

nc Это sf объект, а также фрейм данных. Большинство функций из dplyr или tidyverse хорошо работают на sf объекте. Ниже я использовал slice функцию для разделения nc объекта на nc1 и nc2 .

 # Split the nc object to two sf objects
nc1 <- nc %>% slice(1:50)
nc2 <- nc %>% slice(51:100)

# Print the crs of nc, nc1, and nc2
st_crs(nc)
# Coordinate Reference System:
#   EPSG: 4267 
#   proj4string: " proj=longlat  datum=NAD27  no_defs"
st_crs(nc1)
# Coordinate Reference System:
#   EPSG: 4267 
#   proj4string: " proj=longlat  datum=NAD27  no_defs"
st_crs(nc2)
# Coordinate Reference System:
#   EPSG: 4267 
#   proj4string: " proj=longlat  datum=NAD27  no_defs"
  

Как вы можете видеть, nc , nc1 и nc2 все имеют одинаковую систему координат, и между nc1 и nc2 нет перекрывающихся областей.

Поскольку sf объекты являются data frames , моя первая мысль объединить два data frames — использовать bind_rows из dplyr пакета. Однако bind_rows выдал мне предупреждение.

 # Combine nc1 and nc2 with bind_rows
nc_combine <- bind_rows(nc1, nc2)
# Warning messages:
#   1: In bind_rows_(x, .id) :
#     Vectorizing 'sfc_MULTIPOLYGON' elements may not preserve their attributes
#   2: In bind_rows_(x, .id) :
#     Vectorizing 'sfc_MULTIPOLYGON' elements may not preserve their attributes
  

Новый объект nc_combine по-прежнему является sf объектом data frame с тем же номером строки и столбца, что и nc . Однако я не могу получить доступ к какой-либо информации в nc_combine , и информация о координатах, похоже, исчезла.

 class(nc_combine)
# [1] "sf"         "data.frame"

dim(nc_combine)
# [1] 100  15

nc_combine
# Error in .subset2(x, i, exact = exact) : 
#   attempt to select less than one element in get1index
  

Другими словами, мой вопрос заключается в том, как объединить nc1 и nc2 воссоздать nc объект?

Ответ №1:

Есть такая rbind функция, которая была в R с оооо 1990 года-что-то вроде:

 > rbind(nc1,nc2)
Simple feature collection with 100 features and 14 fields
geometry type:  MULTIPOLYGON
dimension:      XY
bbox:           xmin: -84.32385 ymin: 33.88199 xmax: -75.45698 ymax: 36.58965
epsg (SRID):    4267
proj4string:     proj=longlat  datum=NAD27  no_defs
First 10 features:
[etc]
  

Я не знаю, почему bind_rows не работает.

Комментарии:

1. Да, мне следовало сначала протестировать rbind. Спасибо.