#r #dplyr #tidyverse #xlsx #data-manipulation
Вопрос:
У меня есть файл excel под названием «data_12.18.2020.xlsx». Я хочу извлечь часть имени файла с датой и создать столбец даты по мере чтения в файле. Есть ли способ сделать это в вызове dplyr?
Ответ №1:
Вы можете извлечь дату из имени файла с помощью регулярного выражения и добавить ее в качестве нового столбца с помощью mutate
.
library(dplyr)
file <- "data_12.18.2020.xlsx"
date <- sub('data_(\d \.\d .\d )\.xlsx', '\1', file)
df <- read.xlsx(file) %>% mutate(date = date)