Как получить текст из URL-адресов с помощью regexp_extract в data studio

#regex #google-data-studio #re2

#регулярное выражение #google-data-studio #re2

Вопрос:

Примеры URL-адресов:

  1. /ru/текущий сезон/abc-note-book/2018-abc-note-book-arun-1
  2. /ru/текущийсезон/xyz-записная книжка/2018-xyz-записная книжка-кумар-2
  3. /ru/текущий сезон /pqr-записная книжка /2018-pqr-записная книжка-рахул-3

Я хочу извлечь раздел ‘abc-note-book’ в виде столбца 1 из всех URL-адресов

Ожидаемый результат:

  1. азбука для заметок
  2. блокнот xyz
  3. блокнот pqr

А также необходимо извлечь раздел ‘arun-1’ в виде столбца 2 из всех URL-адресов

Ожидаемый результат

  1. arun-1
  2. кумар-2
  3. рахул-3

Пожалуйста, подскажите, как извлечь с помощью regexp_extract в data studio? Или есть какая-либо другая формула для его извлечения.

Спасибо.

Ответ №1:

Создал отчет Google Data Studio (встроенные таблицы Google) для демонстрации. Требуемый текст может быть извлечен с помощью функции REGEXP_EXTRACT, а в случае столбца 1 REGEXP_REPLACE может быть использован для замены — пробелом:

Столбец 1 (например, записная книжка abc)

 REGEXP_REPLACE(REGEXP_EXTRACT(URL, "/\d -(\w -\w -\w )"), "-", " ")
  

Столбец 2 (например, arun-1)

 REGEXP_EXTRACT(URL, "(\w -\d )$")