#python #pandas
Вопрос:
Я экспериментировал с операторами печати в следующем коде и не могу правильно настроить вывод.
Цель программы-подсчитать количество отдельных расширений файлов, а затем типизировать их в словаре или фрейме данных pandas.
Однако до сих пор фрейм данных, а также словарь, по-видимому, имеют одно расширение типа файла, однако
из вывода на печать я могу понять из тестирования в моей собственной файловой системе, что несколько типов расширений файлов, по крайней мере, распознаются оператором.
extension_match = match.group(1)
print("break")
print(extension_match)
Однако я не понимаю, как именно фрейм данных, по-видимому, улавливает только одно расширение типа, а затем отслеживает, не вводя другие расширения в начальное расширение файла словаря
полное программирование
import os, re
import pandas as pd
pattern = re.compile(r'[w.]*.([a-zA-Z] )')
def dictionary_search_test():
get_directory = os.chdir(input("Please input directory to search"))
file_extension={}
for i in os.listdir(get_directory):
match = re.search(pattern, i)
print(match)
size = os.stat(i).st_size
extension_match = match.group(1)
print("break")
print(extension_match)
if extension_match in file_extension.keys():
file_extension[extension][0] =1
if size > file_extension[extension][3]:
file_extension[extension][3] = size
elif size < file_extension[extension][1]:
file_extension[extension][1] = size
file_extension[extension][2] = (file_extension[extension][2] size) / file_extension[extension][0]
else:
file_extension[extension] = [1, size, size, size]
dictionary = {"Extension":[], "Count":[], "Minimum":[], "Average":[], "Maximum":[]}
print("break")
print(dictionary)
for s in file_extension:
dictionary["Extension"].append(s)
dictionary["Count"].append(file_extension[s][0])
dictionary["Minimum"].append(file_extension[s][1])
dictionary["Average"].append(file_extension[s][2])
dictionary["Maximum"].append(file_extension[s][3])
df = pd.DataFrame.from_dict(dictionary, orient='index')
print(df)
print(dictionary)