#python #sequence #python-embedding
Вопрос:
когда я пытаюсь внедрить последовательность белка, она показывает ошибку типа: индексы списка должны быть целыми числами или срезами, а не str
import pandas as pd
data = [[1, 'MPGPR'], [2, 'MLAR'], [3, 'MEA']]
df = pd.DataFrame(data, columns = ['Id', 'Sequence'])
seqlist = [list(x) for x in df.Sequence.values]
from sgt import SGT
sgt = SGT(kappa=10, lengthsensitive = False)
embedding = sgt.fit_transform(corpus=seqlist) #this creates list containing embedding vectors for the sequences