#python #nlp #text-processing
#python #нлп #обработка текста
Вопрос:
У меня есть следующие два текстовых сценария —
Text = «Boy000» Text_2 = «3D»
результаты, которые я ищу, — это Text = Boy и Text_2 = 3D
Мой текущий код выглядит следующим образом
sent_punc.translate(remove_digits).replace(' ',' ')
однако это приводит к — Boy и D
Комментарии:
1. Итак, вы хотите удалить только цифры в конце строки?
2. Спасибо за ответ. Это больше похоже на стратегию удаления цифр, если буквенно-цифровое слово не имеет смысла или не является частью какой-либо литературы. Пример — Boy00 = Boy, B00oy = Boy, 00Boy = Boy 3D = 3D
3. Проверьте строку
/usr/share/dict/words
и примените, если не найдено. Я отмечаю, что он содержит как «Boy», так и «3D».4. Как мне создать этот код для Windows os wordlist = [line.strip() для строки в open(‘/ usr / share/ dict /words’)] ??