«Неверный ключ: 0. Пожалуйста, сначала выберите разделение. Например: `my_dataset_dictionary[‘поезд’] [0]`. Доступные расколы: [«поезд»]»

#dataset #huggingface-transformers

Вопрос:

Я попытался использовать API набора данных, загруженный моими собственными данными, для обучения модели hunggingface. Это мой код:

 train_data= datasets.load_dataset('csv', data_files="/gdrive/MyDrive/project/train.csv")  test_data= datasets.load_dataset('csv', data_files="/gdrive/MyDrive/project/test.csv")  
 train_data  DatasetDict({  train: Dataset({  features: ['Post', 'Label'],  num_rows: 174  }) })  

Но в тренажере я получаю это сообщение об ошибке. Что происходит с моим набором данных. Я не нахожу никакой ошибки. Не могли бы вы мне помочь? Спасибо!

 trainer = Trainer(  model=model,  args=training_args,  train_dataset=train_data,  eval_dataset=test_data ) trainer.train() KeyError Traceback (most recent call last) lt;ipython-input-63-3435b262f1aegt; in lt;modulegt;() ----gt; 1 trainer.train()  5 frames /usr/local/lib/python3.7/dist-packages/datasets/dataset_dict.py in __getitem__(self, k)  44 suggested_split = available_suggested_splits[0] if available_suggested_splits else list(self)[0]  45 raise KeyError( ---gt; 46 f"Invalid key: {k}. Please first select a split. For example: "  47 f"`my_dataset_dictionary['{suggested_split}'][{k}]`. "  48 f"Available splits: {sorted(self)}"  KeyError: "Invalid key: 0. Please first select a split. For example: `my_dataset_dictionary['train'][0]`. Available splits: ['train']"  

Комментарии:

1. Вы пробовали train_dataset=train_data[‘поезд’] ?

2. это работает для train_data. Но как установить значение test_data? когда я запускаю » test_dataset=test_data[‘тест’] «, это показывает мне, что у меня есть ошибка ключа: «тест». Спасибо!

3. Вы можете быстро проверить test_data и взять ключ, который он содержит.