#python #python-3.x #string #list #text
Вопрос:
Я хочу перевести 100 текстовых строк в 100 серий, где каждое уникальное слово вместо этого представлено его номером.
У меня есть словарь, в котором каждое уникальное слово в 100 текстовых строках имеет соответствующий номер.
У меня также есть список с каждой текстовой строкой.
Я хочу перебирать список с текстовыми строками и определять каждый раз, когда слово в моем словаре-ключе находится в текстовой строке, а затем заменять его соответствующим номером в моем словаре.
Приведенный ниже код-это все, что я могу сказать. Но с помощью этого метода мне пришлось бы сделать цикл for для каждого значения в списке ft. Ниже приведен пример с фиктивным текстом.
# Create list with text to translate into numbers
ft=list(['Consectetur quisquam aliquam quiquia adipisci ut labore ut sit eius etincidunt velit ipsum amet velit amet modi non quiquia quisquam adipisci dolor quiquia etincidunt quisquam dolore adipisci est quiquia quaerat neque consectetur sed non numquam porro aliquam sed voluptatem numquam consectetur magnam modi sit eius adipisci quisquam sed ut dolorem quisquam sit velit quisquam consectetur consectetur porro dolorem quiquia non dolore modi amet tempora etincidunt ut est sit quaerat dolorem consectetur etincidunt tempora velit voluptatem dolorem voluptatem sed modi ipsum labore adipisci tempora ipsum modi est non etincidunt porro sit etincidunt quaerat quisquam magnam quisquam aliquam modi aliquam aliquam est adipisci amet ipsum quaerat adipisci consectetur velit dolor quisquam non adipisci ipsum labore adipisci quisquam quaerat magnam eius voluptatem ut velit velit quaerat adipisci est non velit est labore labore eius magnam eius', 'Magnam aliquam tempora dolorem quaerat non quiquia numquam eius labore tempora ut neque dolor modi eius aliquam numquam quisquam ut sit est eius quisquam porro sed adipisci dolore porro amet eius sit adipisci sit dolore magnam neque sed modi tempora aliquam etincidunt quisquam dolor ipsum ut amet etincidunt consectetur non ipsum quisquam sed ipsum sit tempora consectetur sit consectetur velit etincidunt dolore labore adipisci ut dolor adipisci magnam sed quiquia etincidunt velit quisquam consectetur dolore ipsum modi sed est quiquia eius quisquam magnam voluptatem ut sit ut etincidunt dolore porro modi porro aliquam eius tempora neque porro eius dolorem etincidunt porro dolore quisquam quiquia quisquam quiquia sed quisquam consectetur ipsum ut tempora numquam adipisci'])
# Make dataframe in order to lower and to tokenize so that I can identify unique words
df_ft = DataFrame(ft,columns=['Value'])
new_ft =''.join(ft).lower()
new_ft_token = word_tokenize(new_ft)
unique=set(new_ft_token)
# Create a unique number and combine it to a dictionary
numbers = list(range(1,29))
unique_list = list(unique)
uni_dict = dict(zip(unik_liste, numbers))
# My attempt on a for loop substituting words with numbers
new_number_text = []
for k, v in uni_dict.items():
if k in ft[1]:
new_number_text.append([k,v])
Комментарии:
1. зачем нужен
ft = list(['Consectertur ........'])
его уже список, верно?2. Иг ты имел в виду
s = 'Conserctertur ....'; ft = list(s.split())
3. @парень__шляпа_спасибо, в этом больше смысла!