#wget
#wget
Вопрос:
Возможно ли начать с http://host/foo/bar/baz/index.cgi?page=1 и рекурсивно извлекать любой контент под http://host/foo /? (Не удается начать сhttp://host/foo / поскольку это недопустимая страница.) Я просмотрел различные варианты управления тем, что извлекает wget recursive, такие как —no-parent и —include-directories, но, похоже, я не могу найти вариант для выполнения вышеуказанного, например, простой фильтр подстроки URL.
Ответ №1:
Оказывается, --include-directories
делает то, что я хочу — я просто неправильно его использовал. Я должен был сделать:
wget --include-directories /foo 'http://host/foo/bar/baz/index.cgi?page=1'