Как я могу выделить максимальное количество функций для векторизатора счетчика?

#vectorization #tf-idf #countvectorizer

#векторизация #tf-idf #countvectorizer

Вопрос:

Я создал векторизатор счетчика с помощью skitlearn, но получил синтаксическую ошибку в «max_features». «max_features» работал, когда я создавал TfidfVectorizer. Как я могу установить максимальное количество функций для векторизатора счетчика?

 vectorizer = CountVectorizer(analyzer='word',
                         lowercase=False,
                         tokenizer=None,
                         preprocessor=None,
                         min_df=2,
                         ngram_range=(1,1)
                         max_features=1000
                         )
  

Ответ №1:

Я думаю, вы пропустили , после ngram_range (1, 1) .

Попробуйте это :

 vectorizer = CountVectorizer(analyzer='word',
                     lowercase=False,
                     tokenizer=None,
                     preprocessor=None,
                     min_df=2,
                     ngram_range=(1,1),
                     max_features=1000
                     )