Фразы дают другой вывод из фразера
#gensim Вопрос: Я пытаюсь генерировать биграммы и триграммы для моделирования темы LDA. Мой код приведен ниже; bigram = gensim.models.Phrases(data.normalized, min_count=5, threshold=5, connector_words=gensim.models.phrases.ENGLISH_CONNECTOR_WORDS) bigram_mod = gensim.models.phrases.Phraser(bigram) trigram = gensim.models.Phrases(bigram_mod[data.normalized], min_count=5, threshold=2)…