Загружать изображения в облако, а затем вставлять соответствующую ссылку в соответствующий фрейм данных

#python-3.x #pandas #dataframe #cloud #python-camelot

#python-3.x #pandas #фрейм данных #облако #python-camelot

Вопрос:

У меня есть PDF-файлы с таблицами и диаграммой изображений, связанными с содержимым таблиц. И таблица, и изображение на одной странице.

Я извлек таблицы, используя библиотеку Camelot. А также изображения с использованием библиотеки Fitz. Использование Python

Теперь я хочу загрузить эти изображения (.png) в любой возможный облачный сервис и предоставить веб-ссылку соответствующего изображения на фрейм данных соответствующей таблицы.

Пожалуйста, помогите.

Так выглядит одна страница в формате PDF.

Ответ №1:

В случае любого общедоступного облака вы можете использовать S3 для хранения изображений с использованием BOTO3 (библиотека python).

пример кода для хранения изображений в корзине AWS S3:

 import boto3
s3 = boto3.client('s3')
bucket = 'your-bucket-name'
file_name = 'location-of-your-image'
key_name = 'name-of-image-in-s3'
s3.upload_file(file_name, bucket, key_name)
  

Чтобы получить URL-адрес загруженного файла, вы можете сконструировать его как:

 s3_url = f"https://{bucket}.s3.{region}.amazonaws.com/{file_name}"
  

и сохраните s3_url в dataframe.