Функция разделения улья для выбора последней группы

#hadoop #hive #hiveql

#hadoop #улей #hiveql

Вопрос:

Я хочу разделить структуру URL, и меня интересует только последний раздел разделения. например

 www.example.com/subdirect/mainpage.aspx
www.example.com/mainpage4.aspx
www.example.com/subdirect/subdiret/subdirect2/mainpage2.aspx
  

здесь мне нужны только страницы aspx, а не материал до этого, т.е. я хочу вернуть только приведенный ниже текст

 mainpage.aspx
mainpage4.aspx
mainpage2.aspx
  

Я пытался использовать разделение, но я не уверен, как динамически возвращать только последний раздел структуры URL. Есть идеи?
Это сценарий, который я пытался

 select split(URL,'/')[MAX] from URLlist
  

Ответ №1:

Вот решение, использующее regexp_extract

 select regexp_extract(URL, '.*/([^/] )$', 1) from URLlist
  

Это сопоставит и захватит все, что следует за последним / символом