#ruby-on-rails #ruby #search-engine #sphinx
#ruby-on-rails #рубин #поисковая система #sphinx
Вопрос:
У меня есть папки, содержащие XML, которые мне нужно проиндексировать в Sphinx. Я изучил драйвер xmlpipe2, и, насколько я понимаю, он считывает только XML, сгенерированный из скрипта, иначе говоря, из одного источника. Есть ли способ проиндексировать папку с XML-файлами, если у меня нет возможности поместить в нее один XML-файл?
Ответ №1:
Скрипт XMLPipe — это просто скрипт, который выводит XML, который затем принимает sphinx.
Не имеет значения, ОТКУДА этот скрипт получает данные, которые он выводит.
Он мог бы получить это из других XML-файлов, скрипт просто прошелся бы по структуре папок, прочитал все файлы и вывел XML.
Комментарии:
1. Хорошо, это то, что, как я понял, должно было произойти. Спасибо! Я так понимаю, что на выходе не обязательно должен быть основной XML-файл большего размера, а скорее поток xml-документов, которые возвращаются в канал через стандартный вывод?
2. Почти, просто это был бы поток одного XML-документа. Скрипту необходимо вывести один большой XML-файл, просто чтобы он мог передавать его через стандартный вывод