Игнорирование случая для maxDist в stringdist::extract

#r #stringdist

Вопрос:

Я использую stringdist пакет внутри R .

Для нескольких вариантов:

 grab(x, pattern, maxDist = Inf, value = FALSE, ...)

grabl(x, pattern, maxDist = Inf, ...)

extract(x, pattern, maxDist = Inf, ...)
 

он использует maxDist . Однако этот параметр считает расстояние между A и a как единицу. Так же , как и расстояние между A и. b Я бы хотел игнорировать регистр букв, например maxDist . Кто-нибудь знает, как это сделать?

Ответ №1:

Вы можете использовать tolower и написать свой шаблон в нижнем регистре, чтобы игнорировать регистр:

 x <- "Abc"
stringdist::extract(x, pattern = "abd", maxDist = 1)
#>      [,1]
#> [1,] NA
stringdist::extract(tolower(x), pattern = "abd", maxDist = 1)
#>      [,1] 
#> [1,] "abc"
 

Создано 2021-11-04 пакетом reprex (версия v2.0.1)