как получить общее количество всех слов в корпусе?

#java #lucene

#java #lucene

Вопрос:

Например, в коллекции есть 3 документа, документ 1 содержит 25 слов, документ 2 — 30 слов, а документ 3 — 54 слова. Я использую Lucene для индексации коллекции. Теперь, как можно получить общее количество слов в корпусе? (возврат 109)

Ответ №1:

Вы можете получить термины для поля с помощью Fields.terms и количество терминов с помощью Terms.size.

 fields.terms("field").size()