Логистическая регрессия и SVC: Нужно ли масштабировать, если функции являются BOW, tf-idf или Doc2Vec?

#svm #logistic-regression #scaling #doc2vec

Вопрос:

Я знаю, что логистическая регрессия и SVC обычно требуют масштабирования функций. Однако, если функции генерируются

  1. лук
  2. tf-idf
  3. Doc2Vec

нам все еще нужно масштабировать функции?

Спасибо

Ответ №1:

Вам никогда не нужно ничего делать, но вы должны попробовать оба способа и выбрать подход, который лучше соответствует вашим данным и целям.

Комментарии:

1. Спасибо за ваш ответ! Но я хочу понять, почему мне нужно или не нужно масштабировать функции. Например, tf-idf сам по себе тоже считается масштабируемым, поэтому нужно ли мне использовать, скажем, стандартный масштабатор для его масштабирования?

2. Когда вы пробуете разные скалеры, какой из них работает лучше всего? Только после определения этого имеет смысл начать исследовать, «почему» масштабирование или определенный вид масштабирования может помочь.