Выделение SOLR в поле основного текста на основе сопоставления с другим полем, содержащим индекс для сопоставления с

#solr #highlight

#solr #выделение

Вопрос:

У меня есть утилита, которая берет документ, обрабатывает его и генерирует уникальный набор тегов, которые используются для индексации документа предложение за предложением.

Я записываю эти новые теги в поле, отличное от поля содержимого.

Мне было интересно, есть ли какой-либо способ попросить выделение выполнить сопоставление со специальными тегами, но показать выделение исходного содержимого.

В качестве альтернативы, я мог бы встроить исходное предложение в часть моего общего индекса и установить некоторый файловый маркер, чтобы, если выделение соответствовало разделу с индексом, оно могло возвращать текст в теге.

Есть идеи о наилучшем способе сделать это?

Комментарии:

1. Это звучит как возможный вариант использования для полезных нагрузок в сочетании с {!payload_check} . У меня самого нет никакого опыта в этом, но именно с этого я бы начал свое исследование.

2. Спасибо Матслинду, да, я просмотрел полезную нагрузку. Он больше предназначен для ввода чисел, а затем для выполнения запроса суммы на основе совпадения (функции min, max, avg). Я полагаю, что они относятся к термину и также не открыты для запроса HL. так что это не совсем решение.

3. Существуют строки полезной нагрузки, и вы можете использовать эти строки полезной нагрузки для запроса (т. Е. для получения соответствующих токенов). Эти совпадающие токены должны (теоретически) иметь возможность дополнительно выделять и, таким образом, выделять те токены, которые имеют совпадающие полезные нагрузки. Это теория, но именно с этого я бы начал.

4. полезная нагрузка находится в области видимости токена. где я буду работать с объемом предложения. так что это немного сложно. Но я мог бы сделать что-то обратное, например, создать документ из специальных токенов и вставить предложение в качестве полезной нагрузки. Но я не думаю, что вы можете выделить значение полезной нагрузки, только сопоставление.

5. По моему предложению вы должны использовать одно и то же значение полезной нагрузки для всех токенов в одном предложении, что означает, что каждое слово в предложении будет совпадать.