#machine-learning #deep-learning
#машинное обучение #глубокое обучение
Вопрос:
Я хочу классифицировать документы с изображениями (например, паспорт, водительские права и т.д.) С использованием машинного обучения. У кого-нибудь есть какие-либо ссылки или документы, где я могу получить представление о выполнении этой задачи.
Я имею в виду сначала преобразовать документ в текстовый формат, а затем извлечь информацию из текстового файла.Но это я могу делать с одним файлом за раз. Я хочу знать, как я могу выполнить это в миллионах документов.
Ответ №1:
Вам не нужно преобразовывать документы в текст, вы можете сделать это непосредственно с изображениями.
Для выполнения классификации изображений вы можете создавать базовые CNN с помощью библиотеки Keras.
https://towardsdatascience.com/building-a-convolutional-neural-network-cnn-in-keras-329fbbadc5f5
Этого базового CNN будет достаточно для обучения классификатора изображений. Но вы хотите получить точность по последнему слову техники, я рекомендую получить предварительно обученный resnet50 и обучить его созданию классификатора изображений. Помимо точности, есть еще одно важное преимущество использования предварительно обученной сети: вам потребуется меньше данных для подготовки надежного классификатора изображений.
Единственное, что вам нужно изменить, это количество выходных классов с 1000 на нужное вам количество классов.