Python 3.7 Как обновить обработку текстовых блоков, чтобы не обрабатывать слова в фигурных скобках, например {}[]()?

#python #nlp #textblob

Вопрос:

TextBlob это здорово, но его лемматизация, по-видимому, зависит от контекста. К несчастью:

 TextBlob("can't this {example} text [keep] braces (even if that makes no sense).").words
 

доходность

 WordList(['ca', "n't", 'this', 'example', 'text', 'keep', 'braces', 'even', 'if', 'that', 'makes', 'no', 'sense'])
 

когда в данном случае я хотел бы:

 WordList([
    'ca', "n't", 'this', '{example}', 'text', 
    '[keep]', 'braces', '(', 'even', 'if', 
    'that', 'makes', 'no', 'sense', ')', '.'
])
 

Как я могу настроить TextBlob обработку этого сценария?

Вопрос: Что делать, если контракт заключен в скобках тезиса? Затем проигнорируйте его, например.

 [x] "{can't}" -> "{can't}" # this
[ ] "{can't}" -> "{ca", "n't}" # not this