Python получает широту и длину папки изображения в df

#python #pandas #jpeg

#python #pandas #jpeg

Вопрос:

Я попытался создать код на python, чтобы просмотреть все фотографии в папке и получить информацию exif (актуальны только дата и информация GPS). Я нашел код в Интернете, но он выдает ошибку. код :

 def find_images(image_dir, extensions=None):
    default_extensions = ('jpg', 'jpeg')
    if extensions is None:
        extensions = default_extensions
    elif isinstance(extensions, str):
        extensions = (extensions,)
    for root, dirs, filenames in os.walk(image_dir):
        for filename in filenames:
#             print(filename, filename.split('.', 1))
            if filename.split('.', 1)[-1].lower() in extensions:
                yield os.path.join(root, filename)
            
def process_exif_data(image):
    decoded_exif = {}
    with Image.open(image) as image_file:
        exif_data = image_file._getexif()
        if exif_data is None:
            return None
        for tag, value in exif_data.items():
            decoded = TAGS.get(tag, tag)
            if decoded == "GPSInfo":
                decoded_exif.update(decode_gps_data(value))
            else:
                decoded_exif[decoded] = value

    # This could be done with a dict comprehension and a ternary expression too
    return decoded_exif
    

def decode_gps_data(info):
    gps_tags = {GPSTAGS.get(k, k): v for k, v in value.items}

    lat, long = get_coordinates(gps_tags)
    gps_tags['lat'] = lat
    gps_tags['lon'] = lon

    return gps_tags

def get_coordinates(gps_tags):
    coords = {'Latitude': 'N', 'Longitude': 'E'}
    for coord, nominal_ref in coords.items():
        c = gps_tags.get("GPS%s" % coord, None)
        c_ref = gps_tags.get("GPS%sRef" % coord, None)

        if c and c_ref:
            yield _convert_to_degrees(c, c_ref, nominal_ref)
        else:
            yield None
            
def _convert_to_degrees(value, ref, nominal_ref=None):
    if nominal_ref is None:
        nominal_ref = ('N', 'E',)
    elif isinstance(nom, str):
        nominal_ref = (nominal_ref, )
    ref = 1 if ref in nominal_ref else -1
    return ref * sum(float(v[0]) / float(v[1]) / 60 ** i for i, v in enumerate(value))
                        
def extract_important_data(image_data, important_datalabels=('lat', 'lon', 'DateTimeOriginal')):
    if image_data is None:
        return None
    return {key: image_data.get(key, None) for key in important_datalabels}
                        
def extract_info(images, important_datalabels=('lat', 'lon', 'DateTimeOriginal')):
    for image_path in images:
        print(image_path)
        exif_data = process_exif_data(image_path)
        important_data = extract_important_data(exif_data)
        if important_data:
            yield image_path, important_data
                        
def get_photos_info(image_dir, filename=None, important_datalabels=('lat', 'lon', 'DateTimeOriginal')):
    if image_dir is None:
        image_dir='.'

    images = find_images(image_dir)
    info = extract_info(imgs, important_datalabels=important_datalabels)
    result_df = pd.DataFrame(columns = important_datalabels)
    for image_path, item in info:
        result_df.loc[image_path] = item
    if 'DateTimeOriginal' in important_datalabels:
        date_format = '%Y:%m:%d %H:%M:%S'
        result_df['DateTimeOriginal'] = pd.to_datetime(result_df['DateTimeOriginal'], format=date_format)

    if filename:
        result_df.to_excel(filename)

    return result_df

empty_df = pd.DataFrame
empty_df = get_photos_info(r"C:Usersdor hOneDriveDesktopstudyFinal project")
  

ошибка :

 AttributeError                            Traceback (most recent call last)
<ipython-input-32-0aaf3d855413> in <module>
    123 
    124 empty_df = pd.DataFrame
--> 125 empty_df = get_photos_info(r"C:Usersdor hOneDriveDesktopstudyFinal project")
    126 # print(empty_df)

<ipython-input-32-0aaf3d855413> in get_photos_info(image_dir, filename, important_datalabels)
    111     info = extract_info(imgs, important_datalabels=important_datalabels)
    112     result_df = pd.DataFrame(columns = important_datalabels)
--> 113     for image_path, item in info:
    114         result_df.loc[image_path] = item
    115     if 'DateTimeOriginal' in important_datalabels:

<ipython-input-32-0aaf3d855413> in extract_info(images, important_datalabels)
     99     for image_path in images:
    100         print(image_path)
--> 101         exif_data = process_exif_data(image_path)
    102         important_data = extract_important_data(exif_data)
    103         if important_data:

<ipython-input-32-0aaf3d855413> in process_exif_data(image)
     48 def process_exif_data(image):
     49     decoded_exif = {}
---> 50     with Image.open(image) as image_file:
     51         exif_data = image_file._getexif()
     52         if exif_data is None:

D:paythonlibsite-packagesPILImage.py in open(fp, mode)
   2816         exclusive_fp = True
   2817 
-> 2818     prefix = fp.read(16)
   2819 
   2820     preinit()

AttributeError: 'JpegImageFile' object has no attribute 'read'
  

Я где-то читал, что проблема в том, что я пытаюсь открыть уже открытый файл jpg, но я не вижу, где я это делаю, и я не знаю, как это решить.

tnx заранее

Ответ №1:

Похоже, что в строке info = extract_info(imgs, important_datalabels=important_datalabels) imgs опечатка, и вместо этого должно быть images .

Почему это дает вам конкретный режим ошибки, который вы видите, зависит от того, что imgs есть. Переменная imgs должна быть определена где-то в вашей записной книжке, иначе ваш код вызовет ошибку NameError. imgs вероятно, это список или итератор, содержащий какой-то объект, который Image.open() не ожидает; это приведет к сбою при попытке использовать метод объекта read .