#python #deep-learning #huggingface-transformers #broken-pipe #huggingface-tokenizers
#python #глубокое обучение #huggingface-трансформеры #сломанный канал #huggingface-токенизаторы
Вопрос:
Я сталкиваюсь с ошибкой BrokenPipeError, когда пытаюсь запустить анализ настроений с помощью hugging face. Он возвращает [Ошибка №] 32 сломанной трубы.
Ссылка с общим кодом ‘https://colab.research.google.com/drive/1wBXKa-gkbSPPk-o7XdwixcGk7gSHRMas?usp=sharing ‘
Код
def create_data_loader(df, tokenizer, max_len, batch_size):
ds = GPReviewDataset(
reviews=df.content.to_numpy(),
targets=df.sentiment.to_numpy(),
tokenizer=tokenizer,
max_len=max_len
)
return DataLoader(
ds,
batch_size=batch_size,
num_workers=4
)
Далее следует приведенный ниже код
BATCH_SIZE = 16
train_data_loader = create_data_loader(df_train, tokenizer, MAX_LEN, BATCH_SIZE)
val_data_loader = create_data_loader(df_val, tokenizer, MAX_LEN, BATCH_SIZE)
test_data_loader = create_data_loader(df_test, tokenizer, MAX_LEN, BATCH_SIZE)
За которым следует
data = next(iter(train_data_loader))
data.keys()
Я сталкиваюсь с ошибкой с этим « data = next(iter(train_data_loader))
кодом
Ошибка BrokenPipeError: [Errno 32] Broken pipe
Комментарии:
1. Не могли бы вы отредактировать свой вопрос и опубликовать полную трассировку стека ошибок? Определение класса
GPReviewDataset
иDataLoader
также полезно, чтобы помочь вам.2. Я прикрепил ссылку на блокнот colab. Не могли бы вы, пожалуйста, разобраться в этом? Это было бы действительно полезно
3. На самом деле я не могу воспроизвести эту проблему. Пожалуйста, укажите минимальный воспроизводимый пример, который вызывает эту ошибку.
4. Исправлена ошибка путем изменения num_workers с 4 на 0. Если num_workers = 0, то он будет работать только на локальном компьютере.