Ошибка ключа, когда я задаю путь для проекта

#python #pandas #path

#питон #панды #путь

Вопрос:

Когда я запускаю эту программу, я получаю ошибку значения только для определенного пути. Ты знаешь, что с ним происходит?

 # This script generates for each playlist a table with the most similar playlists  # INPUTS # arg1: path to similar playlists config file  import pandas as pd import sys import gc import multiprocessing import time import math import json  from playlist_similarity import calc_similarity_for_playlists from path import fix_path   def load_config(config_path):  with open(config_path, "r") as file:  config = json.load(file)   if "from_pid" in config.keys() and "to_pid" in config.keys():  config["pids"] = list(range(int(config["from_pid"]), int(config["to_pid"])   1))   return config  def process_parameters(all_playlists, n_cpus, playlist_sim_dir, pids, simlarity_metric):  '''  Builds a list of parameters to be applied to each CPU task  :param n_cpus: number of CPUs to be in parallelized  :param all_playlists: DataFrame of play_track.csv  :param playlist_sim_dir: path to save playlist's similarity  :param pids: playlist ids to be calculed to all playlists  :param simlarity_metric: name of the metric to be used to calculate similarity  :return:  '''  range_len = len(pids)  task_len = int(math.floor(range_len / n_cpus))  task_parameters = []   for i in range(n_cpus - 1):  from_index = i * task_len  to_index = (i   1) * task_len   use_pids = pids[from_index : to_index]  task_parameters.append((all_playlists,  playlist_sim_dir,  use_pids,  simlarity_metric))   #there is no previous loop for n_cpus = 1  if n_cpus == 1:  to_index = 0   #create a task for the complementary missing rounds  use_pids = pids[to_index : len(pids)]  task_parameters.append((all_playlists,  playlist_sim_dir,  use_pids,  simlarity_metric))  return task_parameters  def load_and_transform_data(playtrack_csv_path):  print("Loading play_track data...")  playtrack = pd.read_csv(playtrack_csv_path, sep=";")  del playtrack["pos"]  gc.collect()   print("Transforming data...")  playtrack = playtrack.groupby("pid")["track_uri"].apply(lambda serie: serie.tolist())  playtrack = pd.DataFrame(playtrack).reset_index()  playtrack = playtrack.set_index(playtrack["pid"])  return playtrack.to_dict()["track_uri"]  SEP = ";"  ### SCRIPT INPUTS ### config_path = fix_path('C:\Users\user\Desktop\ML\challenge_set.json', is_dir=False) config = load_config(config_path)  playtrack_csv_path = fix_path(config["C:\Users\user\PycharmProjects\play_track.csv"], is_dir=False) playlist_sim_dir = fix_path(config["C:\Users\user\PycharmProjects"]) n_cpus = config["n_cpus"] #####################  start = time.time() all_playlists = load_and_transform_data(playtrack_csv_path) end = time.time() gc.collect() print("Time (s) for loading and processing data: "   str(round(end - start, 4)))  pool = multiprocessing.Pool(n_cpus) tasks_parameters = process_parameters(all_playlists, n_cpus, playlist_sim_dir, config["pids"], config["simlarity_metric"]) results = [] for parameters in tasks_parameters:  results.append(pool.apply_async(calc_similarity_for_playlists, parameters))  for result in results:  print(result.get())

Вот ошибка, которую я получаю при запуске программы:

 playtrack_csv_path = fix_path(config["C:\Users\user\PycharmProjects\play_track.csv"], is_dir=False)  KeyError: 'C:\Users\user\PycharmProjects\play_track.csv'

1. конфигурация-это dic, и ваш путь к файлу не является одним из его ключевых. Попробуйте распечатать конфигурацию, чтобы увидеть структуру словаря, который вы пытаетесь вызвать.

Вопрос:

Комментарии:

Вам также может понравиться

Как перехватывать предупреждающие сообщения в функции, встроенной в другую функцию в matlab

Получение всех столбцов фрейма данных после использования метода ‘groupby’

Тип защиты, когда свойство класса является символом?