выбор ** строк ** данных в соответствии с их источником

Вопрос:

Набор данных, с которым я работаю, содержит 13 столбцов со следующими заголовками (выделено жирным шрифтом) и 302 строки : id: 001, 002,…, 302), исходный код: : AAA, BBB, CCC, дата, день, месяц, год, время, час, минута, секунда,широта, долгота, надписи:NA, 1 или 0.

У меня есть скрипт, который создает карты плотности с использованием этого набора данных, однако я хочу иметь возможность использовать фильтры, которые выбирают данные, которые я хочу, чтобы карты включали и исключали.

пример 1: я хочу выбирать данные ТОЛЬКО с помощью source_code: AAA (и назовите этот выбор данных: data_A)

пример 2: я хочу выбрать данные ТОЛЬКО с исходными кодами AAA и BBB и исключить CCC (и назовите это: data_AB )

пример 3: я хочу выбирать ТОЛЬКО те данные, где надписи = 1 (назовите это: data_in1)

Я предполагаю, что эти фильтры необходимо будет запустить перед запуском скрипта для создания каждой карты.

Я новичок в использовании Rstudio и этой платформы, чтобы задавать вопросы, поэтому заранее извините, если это объяснение расплывчато!

Спасибо!!

Ответ №1:

Если набор данных имеет имя dataset , попробуйте

 i1 <- dataset$source_code == 'AAA'
i2 <- dataset$source_code == 'BBB'
j <- dataset$inscriptions == 1

data_A <- dataset[i1, ]
data_AB <- dataset[i1 | i2, ]
data_in1 <- dataset[j, ]

1. Есть ли причина использовать i1, i2, j? или можно использовать любые буквы? Большое спасибо за столь быстрый ответ

2. @neussegura Могут использоваться любые буквы. Я использовал i1 и i2 потому, что они оба были связаны с одним и тем же source_code столбцом.