#python-3.x #logistic-regression #n-gram #countvectorizer
#python-3.x #logistic-regression #n-грамм #countvectorizer
Вопрос:
У меня есть набор данных, состоящий из списка ngrams для каждого предложения в наборе данных, подобного этому, и тега для каждого предложения:
n-grams=[['thats', 'just', 'great', 'thats just', 'just great', 'thats just great'],
['i', 'dont', 'thats', 'subscribe', 'just', 'to', 'either', 'i dont', 'dont thats', 'thats subscribe', 'subscribe just', 'just to', 'to either', 'i dont thats', 'dont thats subscribe', 'thats subscribe just'],
['what', 'is', 'that', 'when', 'you', 'do', 'just']]
act_tags=tags['statement','statement','Wh_Question']
Я хочу применить логистическую регрессию к n-граммам в качестве объектов и вывести в виде тегов act. Как я должен преобразовать входные данные объектов, которые являются n-граммами, в векторизованную форму, приемлемую для логистической регрессии.