Рекурсивный wget с фильтром URL / в определенном (не родительском) каталоге?

#wget

#wget

Вопрос:

Возможно ли начать с http://host/foo/bar/baz/index.cgi?page=1 и рекурсивно извлекать любой контент под http://host/foo /? (Не удается начать сhttp://host/foo / поскольку это недопустимая страница.) Я просмотрел различные варианты управления тем, что извлекает wget recursive, такие как —no-parent и —include-directories, но, похоже, я не могу найти вариант для выполнения вышеуказанного, например, простой фильтр подстроки URL.

Ответ №1:

Оказывается, --include-directories делает то, что я хочу — я просто неправильно его использовал. Я должен был сделать:

 wget --include-directories /foo 'http://host/foo/bar/baz/index.cgi?page=1'