Ошибка времени выполнения: ошибка времени выполнения cuda (100) . Графический процессор включен, но все еще выдает ошибку

#pytorch #gpu #google-colaboratory

#pytorch #графический процессор #google-colaboratory

Вопрос:

Я новичок в Google Colab и PyTorch. Я использую модель pytorch, но она выдает ошибку времени выполнения Cuda в Google Colab. Мой графический процессор включен в Google colab, но он по-прежнему выдает ошибку, описание графического процессора доступно на изображении ниже. Кто-нибудь может мне помочь?

torch GPU

 THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=47 error=100 : no CUDA-capable device is detected
Traceback (most recent call last):
  File "run.py", line 338, in <module>
    main()
  File "run.py", line 303, in main
    model = model.cuda()
  File "/usr/local/lib/python3.6/dist-packages/torch/nn/modules/module.py", line 458, in cuda
    return self._apply(lambda t: t.cuda(device))
  File "/usr/local/lib/python3.6/dist-packages/torch/nn/modules/module.py", line 354, in _apply
    module._apply(fn)
  File "/usr/local/lib/python3.6/dist-packages/torch/nn/modules/module.py", line 354, in _apply
    module._apply(fn)
  File "/usr/local/lib/python3.6/dist-packages/torch/nn/modules/module.py", line 354, in _apply
    module._apply(fn)
  File "/usr/local/lib/python3.6/dist-packages/torch/nn/modules/module.py", line 376, in _apply
    param_applied = fn(param)
  File "/usr/local/lib/python3.6/dist-packages/torch/nn/modules/module.py", line 458, in <lambda>
    return self._apply(lambda t: t.cuda(device))
  File "/usr/local/lib/python3.6/dist-packages/torch/cuda/__init__.py", line 190, in _lazy_init
    torch._C._cuda_init()
RuntimeError: cuda runtime error (100) : no CUDA-capable device is detected at /pytorch/aten/src/THC/THCGeneral.cpp:47
Read prediction from logs/logs_sparc_editsql/valid_use_predicted_queries_predictions.json
  

Комментарии:

1. Какой графический процессор установлен в системе? Какая версия CUDA установлена? Какие-либо графические процессоры в системе игнорируются из-за переменной среды CUDA_VISIBLE_DEVICES ?

2. @njuffa Я использую Google colab i.stack.imgur.com/QfCnL.png . Это спецификации графического процессора. Также, когда я обучаю другую модель pytorch, она работает на том же графическом процессоре.

3. Версия @ nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2019 NVIDIA Corporation Built on Sun_Jul_28_19:07:16_PDT_2019 Cuda compilation tools, release 10.1, V10.1.243 njuffa Также как узнать, игнорируется ли графический процессор?

Ответ №1:

Nvm, я ставил CUDA_VISIBLE_DEVICES на 5. Это должно быть количество устройств CUDA, которые у вас есть.