Как Правильно Отформатировать Фрейм Данных Pandas/Вывод Словаря Из Соответствия Расширений Файлов

#python #pandas

Вопрос:

Я экспериментировал с операторами печати в следующем коде и не могу правильно настроить вывод.

Цель программы-подсчитать количество отдельных расширений файлов, а затем типизировать их в словаре или фрейме данных pandas.

Однако до сих пор фрейм данных, а также словарь, по-видимому, имеют одно расширение типа файла, однако

из вывода на печать я могу понять из тестирования в моей собственной файловой системе, что несколько типов расширений файлов, по крайней мере, распознаются оператором.

 extension_match = match.group(1)
        print("break")
        print(extension_match)
 

Однако я не понимаю, как именно фрейм данных, по-видимому, улавливает только одно расширение типа, а затем отслеживает, не вводя другие расширения в начальное расширение файла словаря

полное программирование

 import os, re
import pandas as pd


pattern = re.compile(r'[w.]*.([a-zA-Z] )')

def dictionary_search_test(): 
    get_directory = os.chdir(input("Please input directory to search"))

    file_extension={}

    for i in os.listdir(get_directory):
        match = re.search(pattern, i)
        print(match)
        size = os.stat(i).st_size
        extension_match = match.group(1)
        print("break")
        print(extension_match)
        if extension_match in file_extension.keys():
            file_extension[extension][0] =1

            if size > file_extension[extension][3]:

                file_extension[extension][3] = size

            elif size < file_extension[extension][1]:
                file_extension[extension][1] = size

            file_extension[extension][2] = (file_extension[extension][2]   size) / file_extension[extension][0]

        else:
            file_extension[extension] = [1, size, size, size]

    dictionary = {"Extension":[], "Count":[], "Minimum":[], "Average":[], "Maximum":[]}
    print("break")
    print(dictionary)
    for s in file_extension:
        dictionary["Extension"].append(s)
        dictionary["Count"].append(file_extension[s][0])
        dictionary["Minimum"].append(file_extension[s][1])
        dictionary["Average"].append(file_extension[s][2])
        dictionary["Maximum"].append(file_extension[s][3])

    df = pd.DataFrame.from_dict(dictionary, orient='index')
    print(df)
    print(dictionary)