#python-3.x #dataframe #cosine-similarity
#python-3.x #фрейм данных #косинусное сходство
Вопрос:
У меня есть следующий код:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
def get_tf_idf_query_similarity(documents, query):
allDocs = []
for document in documents:
allDocs.append(nlp.clean_tf_idf_text(document))
docTFIDF = TfidfVectorizer().fit_transform(allDocs)
queryTFIDF = TfidfVectorizer().fit(allDocs)
queryTFIDF = queryTFIDF.transform([query])
cosineSimilarities = cosine_similarity(queryTFIDF, docTFIDF).flatten()
return cosineSimilarities
Мне нужно преобразовать эти сходства в DataFrame
вот так:
allDocs
представляет разные документы и query
является одним и тем же новым документом, который оценивается по каждому документу в allDocs
. Как я мог бы выполнить эту операцию? Заранее спасибо