#java #html #text
#java #HTML #текст
Вопрос:
Мне было интересно, есть ли способ преобразовать HTML в предложения, например, с помощью JSoup. То, что я ищу, это что-то вроде:
List<String> convertToSentences(String html);
Иногда предложения разделяются точками, вопросительными и восклицательными знаками, а иногда HTML-структурами, такими как <ul>
‘s и <p>
‘s
Например, учитывая следующий HTML:
<p>Hello World. What a great day.</p> // [Hello world, What a great day]
<ul><li>One</li><li>Two</li></ul> // [One, Two]
<p>Today is <strong>great</great></p> // [Today is great]
Есть ли какая-нибудь библиотека, которая делает такую вещь?