GPU服务器自动安装找不到nvcc
问题描述:
在参考文章“创建实例时自动安装 Tesla 驱动-Linux(推荐)”后,启动GPU实例时发现无法找到nvcc -V
命令,但nvidia-smi
命令可以正常使用。
问题原因:
自动安装过程仅安装了NVIDIA Tesla驱动,并未安装CUDA Toolkit和cuDNN库。nvcc
是CUDA编译器驱动程序,属于CUDA Toolkit的一部分,因此未安装CUDA会导致nvcc -V
命令不可用。
解决方案:
需要手动安装CUDA Toolkit。以下是手动进行安装的步骤:
安装cuda
网址:;target_arch=x86_64&Distribution=Ubuntu&target_version=22.04&target_type=runfile_local
按照自己的系统选择即可:
执行下面的下载安装命令即可,例如cuda12.2.2
代码语言:javascript代码运行次数:0运行复制wget .2.2/local_installers/cuda_12.2.2_535.104.05_linux.runsudo
再执行sh cuda_12.2.2_535.104.05_linux.run
腾讯云安装包地址
CUDA_URL=.4.0_550.54.14_linux.run
替换一下wget .4.0_550.54.14_linux.run
再执行sh cuda_12.2.2_535.104.05_linux.run
输入同意:
注意,当提醒你已经安装了driver的时候,按空格取消。当选择安装内容的时候,务必把driver前面的x取消掉,因为我们已经安装了驱动!!!
:
增加环境变量
CUDA安装完成后,需要配置变量环境才能正常使用。首先在终端输入sudo vi ~/.bashrc打开如下图所示的.bashrc文件。
然后,如下图所示在.bashrc文件的最后添加以下CUDA环境变量配置信息:
export PATH=/usr/local/cuda-12.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64:$LD_LIBRARY_PATH
安装完成后再 nvcc -V 就可以了
发布评论