Извлеките часть имени файла и мутируйте в столбец dplyr R

#r #dplyr #tidyverse #xlsx #data-manipulation

Вопрос:

У меня есть файл excel под названием «data_12.18.2020.xlsx». Я хочу извлечь часть имени файла с датой и создать столбец даты по мере чтения в файле. Есть ли способ сделать это в вызове dplyr?

Ответ №1:

Вы можете извлечь дату из имени файла с помощью регулярного выражения и добавить ее в качестве нового столбца с помощью mutate .

 library(dplyr)

file <- "data_12.18.2020.xlsx"
date <- sub('data_(\d \.\d .\d )\.xlsx', '\1', file)
df <- read.xlsx(file) %>% mutate(date = date)