как преобразовать литры ngrams в представление, приемлемое для логистической регрессии, например, преобразование в векторы?

#python-3.x #logistic-regression #n-gram #countvectorizer

#python-3.x #logistic-regression #n-грамм #countvectorizer

Вопрос:

У меня есть набор данных, состоящий из списка ngrams для каждого предложения в наборе данных, подобного этому, и тега для каждого предложения:

 n-grams=[['thats', 'just', 'great', 'thats just', 'just great', 'thats just great'], 
       ['i', 'dont', 'thats', 'subscribe', 'just', 'to', 'either', 'i dont', 'dont thats', 'thats subscribe', 'subscribe just', 'just to', 'to either', 'i dont thats', 'dont thats subscribe', 'thats subscribe just'], 
       ['what', 'is', 'that', 'when', 'you', 'do', 'just']]

act_tags=tags['statement','statement','Wh_Question']
  

Я хочу применить логистическую регрессию к n-граммам в качестве объектов и вывести в виде тегов act. Как я должен преобразовать входные данные объектов, которые являются n-граммами, в векторизованную форму, приемлемую для логистической регрессии.