#vectorization #tf-idf #countvectorizer
#векторизация #tf-idf #countvectorizer
Вопрос:
Я создал векторизатор счетчика с помощью skitlearn, но получил синтаксическую ошибку в «max_features». «max_features» работал, когда я создавал TfidfVectorizer. Как я могу установить максимальное количество функций для векторизатора счетчика?
vectorizer = CountVectorizer(analyzer='word',
lowercase=False,
tokenizer=None,
preprocessor=None,
min_df=2,
ngram_range=(1,1)
max_features=1000
)
Ответ №1:
Я думаю, вы пропустили ,
после ngram_range (1, 1)
.
Попробуйте это :
vectorizer = CountVectorizer(analyzer='word',
lowercase=False,
tokenizer=None,
preprocessor=None,
min_df=2,
ngram_range=(1,1),
max_features=1000
)