#r
Вопрос:
У меня есть фрейм данных с двумя датами:
- Дата Создания
- Последний доступ
Я хочу напечатать все годы, которые существуют в моих данных, внутри цикла:
- 1989
- 2017
- 2018
- 2019
- 2020
- 2021
Я пытался создать код, который делает это, но он выдает мне ошибку:
- Ошибка в df_years[x, 1:1] : неверное количество измерений
# Libraries
library(ggplot2)
library(data.table)
library(tidyr)
library(dplyr) # select two columns
# Read data
df = read.csv2(text = "File.Name|Created.Date|Last.Accessed|Visual.Group
60be1ba43bf7cjpg|1989-11-17 06:25:22|2017-07-15 01:25:22|0
60be1ba43bf89jpg|1989-02-04 04:03:16|2021-12-17 04:03:16|1
60be1ba43bf8djpg|2017-04-22 14:57:13|2017-11-17 23:57:13|2
60be1ba43bf90jpg|2021-04-12 23:03:44|2018-11-17 05:03:44|3
60be1ba43bf93jpg|2019-08-28 18:23:16|1989-09-07 12:23:16|4
60be1ba43bf95jpg|1989-09-11 08:16:20|2020-03-17 10:16:20|5
60be1ba43bf98jpg|2018-08-01 16:56:05|2017-04-24 03:56:05|5
60be1ba43c0b2jpg|1989-06-23 23:50:52|2017-09-08 02:50:52|56
60be1ba43c0b5jpg|2019-09-01 04:29:25|2020-10-25 00:29:25|56
60be1ba43c0b8jpg|2020-08-08 07:08:47|2021-05-22 20:08:47|57
60be1ba43c0bbjpg|2018-04-11 07:32:17|2018-06-21 12:32:17|58
60be1ba43c0bdjpg|2021-05-26 08:32:28|1989-02-04 12:32:28|58
60be1ba43c0c0jpg|1989-11-25 22:22:37|2019-07-16 04:22:37|58
60be1ba43c0c4jpg|2018-02-03 10:37:57|2019-08-02 08:37:57|58
60be1ba43c0c7jpg|2018-08-18 06:36:04|1989-03-17 08:36:04|58
60be1ba43c0cajpg|2019-02-12 23:31:52|2020-06-17 13:31:52|59",
sep="|",stringsAsFactors=TRUE, na.strings="unknown");
# Remove duplicates (Visual group defines duplicate)
df <-df[!duplicated(df$Visual.Group), ]
# Extract year
df$Created.Date.Year <- format(as.Date(df$Created.Date, format="%Y-%m-%d"), format="%Y");
df$Last.Accessed.Year <- format(as.Date(df$Last.Accessed, format="%Y-%m-%d"), format="%Y");
# Merge years from created and last accessed
df_years <- unique(c(df$Created.Date.Year,df$Last.Accessed.Year))
number_of_years <- length(df_years) # count
for(x in 1:number_of_years) {
year <- df_years[x, 1:1]
cat(year, "n");
}
Обновление: Точный ожидаемый результат:
1989
2017
2018
2019
2020
2021
Комментарии:
1. Можете ли вы показать свой точный ожидаемый результат?
2. Я обновил ожидаемый результат. Я хочу, чтобы годы были напечатаны за один год.
Ответ №1:
Без петли, после того, как вы извлекли годы
unique(c(df$Created.Date.Year,df$Last.Accessed.Year))
[1] "1989" "2017" "2021" "2019" "2020" "2018"
Изменить: ежегодная частота?
table(c(df$Created.Date.Year,df$Last.Accessed.Year))
1989 2017 2018 2019 2020 2021
5 4 3 2 3 3
Комментарии:
1. Можете добавить
sort
перед этим, если вы тоже хотите, чтобы они были в порядке 🙂2. Действительно хороший код. Они должны быть в порядке, и мне также нужно посчитать количество лет, чтобы иметь возможность перебирать их.
3. df_years Год,df$Последний. Доступный. Год)) number_of_years <- длина(df_years) # количество для(x в 1:number_of_years) { год <- df_years[x, 1:1] кошка(год, «n»); last_printed_year
Ответ №2:
Другой базовый вариант R с использованием union
> do.call(union, unname(df[tail(names(df), 2)]))
[1] "1989" "2017" "2021" "2019" "2020" "2018"