Классификация графических документов с использованием машинного обучения

#machine-learning #deep-learning

#машинное обучение #глубокое обучение

Вопрос:

Я хочу классифицировать документы с изображениями (например, паспорт, водительские права и т.д.) С использованием машинного обучения. У кого-нибудь есть какие-либо ссылки или документы, где я могу получить представление о выполнении этой задачи.

Я имею в виду сначала преобразовать документ в текстовый формат, а затем извлечь информацию из текстового файла.Но это я могу делать с одним файлом за раз. Я хочу знать, как я могу выполнить это в миллионах документов.

Ответ №1:

Вам не нужно преобразовывать документы в текст, вы можете сделать это непосредственно с изображениями.

Для выполнения классификации изображений вы можете создавать базовые CNN с помощью библиотеки Keras.

https://towardsdatascience.com/building-a-convolutional-neural-network-cnn-in-keras-329fbbadc5f5

Этого базового CNN будет достаточно для обучения классификатора изображений. Но вы хотите получить точность по последнему слову техники, я рекомендую получить предварительно обученный resnet50 и обучить его созданию классификатора изображений. Помимо точности, есть еще одно важное преимущество использования предварительно обученной сети: вам потребуется меньше данных для подготовки надежного классификатора изображений.

https://engmrk.com/kerasapplication-pre-trained-model/?utm_campaign=Newsamp;utm_medium=Communityamp;utm_source=DataCamp.com

Единственное, что вам нужно изменить, это количество выходных классов с 1000 на нужное вам количество классов.