#python #deep-learning #text-parsing #bert-language-model #named-entity-recognition
Вопрос:
Я создаю алгоритм сопоставления адресов. Основная проблема заключается в том, что предыдущие модели, такие как Условные случайные поля (CRF)от Paserator и Усредненный персептрон от Libpostal, неправильно соответствуют объектам адресов.
Я использую бесплатный образец из AddressBases premium https://www.ordnancesurvey.co.uk/business-government/products/addressbase-premium.
Я хочу, чтобы при анализе адреса алгоритм выглядел так:
bert.parser('FLAT ABC 7-9 TEDWORTH SQUARE LONDON SW3 4DU')
он вернет проанализированные токены с высокой точностью
('BuildingName', '7-9'),
('StreetName', 'TEDWORTH SQUARE'),
('TownName', 'LONDON'),
('Postcode', 'SW3 4DU')])
Я просмотрел адресную сеть, адрес пользователя, Deepmatcher и китайский адрес с (БЕРТ) https://huggingface.co/cola/chinese-address-ner
Я ищу что-нибудь на английском языке с БЕРТОМ (RNN,lSTM) для этой проблемы.