#hadoop #hive #hiveql
#hadoop #улей #hiveql
Вопрос:
Я хочу разделить структуру URL, и меня интересует только последний раздел разделения. например
www.example.com/subdirect/mainpage.aspx
www.example.com/mainpage4.aspx
www.example.com/subdirect/subdiret/subdirect2/mainpage2.aspx
здесь мне нужны только страницы aspx, а не материал до этого, т.е. я хочу вернуть только приведенный ниже текст
mainpage.aspx
mainpage4.aspx
mainpage2.aspx
Я пытался использовать разделение, но я не уверен, как динамически возвращать только последний раздел структуры URL. Есть идеи?
Это сценарий, который я пытался
select split(URL,'/')[MAX] from URLlist
Ответ №1:
Вот решение, использующее regexp_extract
select regexp_extract(URL, '.*/([^/] )$', 1) from URLlist
Это сопоставит и захватит все, что следует за последним /
символом