Не удалось загрузить динамическую библиотеку «libcuda.so.1»; ошибка: libcuda.so.1:

#python #tensorflow

Вопрос:

Я использую удаленный сервер для запуска своего скрипта python, у него есть NVIDIA, и я хочу использовать его для ускорения времени обработки.

Я загрузил следующие пакеты, как описано в этом руководстве:

 tensorflow-gpu            2.4.1           h30adc30_0.conda
tensorflow                2.4.1           gpu_py39h8236f22_0.conda          
cudatoolkit               10.1.243        nvidia
cudnn                     7.6.5           cuda10.1_0    anaconda
 

Когда я хочу проверить установку:

из tensorflow.python.клиент импортирует печать device_lib(device_lib.list_local_devices())

Возникают следующие ошибки:

 2021-09-01 19:44:44.950015: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE4.1 SSE4.2 AVX
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
2021-09-01 19:44:44.978949: W tensorflow/stream_executor/platform/default/dso_loader.cc:60] Could not load dynamic library 'libcuda.so.1'; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory; LD_LIBRARY_PATH: /app/utils/anaconda3/lib:/rruser/home/anaconda3/lib:
2021-09-01 19:44:44.979005: W tensorflow/stream_executor/cuda/cuda_driver.cc:326] failed call to cuInit: UNKNOWN ERROR (303)
2021-09-01 19:44:44.979070: I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:156] kernel driver does not appear to be running on this host (klogin1): /proc/driver/nvidia/version does not exist
2021-09-01 19:44:44.979110: I tensorflow/compiler/jit/xla_gpu_device.cc:99] Not creating XLA devices, tf_xla_enable_xla_devices not set
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 7297103817937650454
]
 

Комментарии:

1. Вам нужен графический процессор NVIDIA, и вам нужно установить соответствующий драйвер для этого графического процессора.

2. @RobertCrovella как использовать графический процессор NVIDIA на сервере?

3. Вы установили драйверы nvidia? Ошибки указывают на то, что драйверы не запущены.

4. Установка LD_LIBRARY_PATH решает проблему: export LD_LIBRARY_PATH=/usr/local/cuda-10.1/compat/:$LD_LIBRARY_PATH . Спасибо!