Может ли поисковая система Sphinx индексировать папку с файлами XML?

#ruby-on-rails #ruby #search-engine #sphinx

#ruby-on-rails #рубин #поисковая система #sphinx

Вопрос:

У меня есть папки, содержащие XML, которые мне нужно проиндексировать в Sphinx. Я изучил драйвер xmlpipe2, и, насколько я понимаю, он считывает только XML, сгенерированный из скрипта, иначе говоря, из одного источника. Есть ли способ проиндексировать папку с XML-файлами, если у меня нет возможности поместить в нее один XML-файл?

Ответ №1:

Скрипт XMLPipe — это просто скрипт, который выводит XML, который затем принимает sphinx.

Не имеет значения, ОТКУДА этот скрипт получает данные, которые он выводит.

Он мог бы получить это из других XML-файлов, скрипт просто прошелся бы по структуре папок, прочитал все файлы и вывел XML.

Комментарии:

1. Хорошо, это то, что, как я понял, должно было произойти. Спасибо! Я так понимаю, что на выходе не обязательно должен быть основной XML-файл большего размера, а скорее поток xml-документов, которые возвращаются в канал через стандартный вывод?

2. Почти, просто это был бы поток одного XML-документа. Скрипту необходимо вывести один большой XML-файл, просто чтобы он мог передавать его через стандартный вывод