как исправить ложную проблему torch.cuda.is_available () без перезапуска компьютера?

#python #ubuntu #pytorch

#python #ubuntu #pytorch

Вопрос:

У меня есть:

 $ python
Python 3.7.6 (default, Jan  8 2020, 19:59:22) 
[GCC 7.3.0] :: Anaconda, Inc. on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> torch.cuda.is_available()
False
>>> quit()

$ nvidia-smi
Wed Oct 14 21:28:50 2020       
 ----------------------------------------------------------------------------- 
| NVIDIA-SMI 450.51.06    Driver Version: 450.51.06    CUDA Version: 11.0     |
|------------------------------- ---------------------- ---------------------- 
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|=============================== ====================== ======================|
|   0  GeForce RTX 2070    Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   47C    P8     9W /  N/A |   1257MiB /  7982MiB |     11%      Default |
|                               |                      |                  N/A |
 ------------------------------- ---------------------- ---------------------- 
                                                                               
 ----------------------------------------------------------------------------- 
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1424      G   /usr/lib/xorg/Xorg                823MiB |
|    0   N/A  N/A      1767      G   /usr/bin/gnome-shell              407MiB |
|    0   N/A  N/A      6420      G   /usr/lib/firefox/firefox            2MiB |
|    0   N/A  N/A      6949      G   /usr/lib/firefox/firefox            2MiB |
|    0   N/A  N/A      7447      G   /usr/lib/firefox/firefox            2MiB |
|    0   N/A  N/A      8888      G   /usr/lib/firefox/firefox            2MiB |
|    0   N/A  N/A      9218      G   /usr/lib/firefox/firefox            2MiB |
|    0   N/A  N/A      9282      G   /usr/lib/firefox/firefox            2MiB |
|    0   N/A  N/A     65854      G   /usr/lib/firefox/firefox            2MiB |
|    0   N/A  N/A     70801      G   /usr/lib/firefox/firefox            2MiB |
 ----------------------------------------------------------------------------- 
  

Есть ли способ, которым я мог бы решить эту проблему без перезагрузки моего компьютера?

У меня Ubuntu 20.04 и PyTorch 1.6.0

После того, как я перезапустил компьютер, вот что я получаю: введите описание изображения здесь

Комментарии:

1. Я думаю, вполне вероятно, что вы могли бы настроить среду anaconda на этой машине, которая будет работать с pytorch conda install pytorch torchvision cudatoolkit=10.2 -c pytorch см. Здесь . Ваш драйвер 450.xx будет нормально работать с CUDA 10.2

2. У меня нет никаких проблем с версией моего драйвера, и по большей части она работает. Иногда возникает эта ошибка, из-за которой мне приходится перезапускать компьютер, чтобы ее исправить

Ответ №1:

Это случается довольно часто с пользователями ubuntu (я не так уверен в других дистрибутивах). Я заметил это поведение, особенно когда я оставляю свою машину в спящем режиме. Без перезапуска вы можете выполнить следующие команды, как указано в этой теме

sudo rmmod nvidia_uvm
sudo modprobe nvidia_uvm