Как удалить ‘Jesu’, чтобы получить ‘Jesus’ в wordcloud?

#word-cloud #stemming

#облако слов #stemming

Вопрос:

Пытаюсь получить изображение в формате .png с помощью wordcloud из книги по Библии. Слово «Иисус» происходит от слова «Иисус». Есть ли способ сделать исключение только для этого одного слова? Как ни странно, ‘Moses’ не stemmed.

 {file_content = open("Wheres_Heaven.txt").read()}

{wordcloud = WordCloud(stopwords=None, background_color = 'white', width=1200, height=1000, max_words = 500, ).generate(file_content)}

{plt.figure( figsize=(20,10) )
{plt.imshow(wordcloud)}
{plt.axis('off')}
{plt.savefig('Heaven.png')}
{plt.show()}
 

Небеса.png

Ответ №1:

Если у вас версия 1.8.1, то вы можете вставить «Jesu» в стоп-слова.

Логика заключается в том, что когда он видит в тексте как «Jesu», так и «Иисус», код предполагает, что это множественное число. По-видимому, в тексте нет «Mose», поэтому это не рассматривалось как множественное число.

Комментарии:

1. Спасибо за решение. Я добавил слово ‘Jesu’ к своим стоп-словам wordcloud и запустил код. Результат был именно таким, как я хотел.