Сценарий — как анализировать буквенно-цифровые слова на основе словаря / литературы

#python #nlp #text-processing

#python #нлп #обработка текста

Вопрос:

У меня есть следующие два текстовых сценария —

Text = «Boy000» Text_2 = «3D»

результаты, которые я ищу, — это Text = Boy и Text_2 = 3D

Мой текущий код выглядит следующим образом

 sent_punc.translate(remove_digits).replace('  ',' ')
  

однако это приводит к — Boy и D

Комментарии:

1. Итак, вы хотите удалить только цифры в конце строки?

2. Спасибо за ответ. Это больше похоже на стратегию удаления цифр, если буквенно-цифровое слово не имеет смысла или не является частью какой-либо литературы. Пример — Boy00 = Boy, B00oy = Boy, 00Boy = Boy 3D = 3D

3. Проверьте строку /usr/share/dict/words и примените, если не найдено. Я отмечаю, что он содержит как «Boy», так и «3D».

4. Как мне создать этот код для Windows os wordlist = [line.strip() для строки в open(‘/ usr / share/ dict /words’)] ??