云计算百科
云计算领域专业知识百科平台

最新 :服务器的cuda版本太老旧怎么办--cuda安装指南


0.写在前面

最近开学换了新的服务平台实例,发现里面的配置很旧,又发现网上没有相关最新教程。 以安装cuda12.2为例 … 本来想直接安装我驱动能够支持的最新的cuda 后来发现这样及其不方便 ,大家还是安装经典的,用的多比如11.8 ,12.1,12.4,这样安装torch方便,比如

conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.1 -c pytorch -c nvidia


1. 确认 NVIDIA 驱动是否支持 CUDA 12.2

CUDA 的运行依赖 NVIDIA 驱动程序,确保你的 NVIDIA 驱动版本足够新。如果版本过低,先升级驱动。

检查当前驱动版本

运行以下命令,查看当前 NVIDIA 驱动程序的版本:

nvidia-smi

在输出的顶部,你会看到 Driver Version,例如:

+—————————————————————————–+
| NVIDIA-SMI 470.182.03 Driver Version: 470.182.03 CUDA Version: 11.4 |
+—————————————————————————–+

在这里插入图片描述


2. 下载和安装 CUDA 12.2

2.1 下载 CUDA 12.2 安装包

去 CUDA 官方下载页面 下载 12.2 版本的安装包。 在这里插入图片描述

示例:

以 Ubuntu 20.04 为例,选择以下选项:

  • Operating System:Linux
  • Architecture:x86_64 //不知道就在服务器输入:uname -m
  • Distribution:Ubuntu //不知道就在服务器输入:lsb_release -a
  • Version:20.04 // 由上条命令可得
  • Installer Type:deb (local) // 有local就行

在这里插入图片描述

点击 Download 按钮,复制安装命令。

3.2 添加 CUDA 仓库并安装

在终端中执行官方给出的安装命令。例如:

wget wget https://developer.download.nvidia.com/compute/cuda/12.1.1/local_installers/cuda_12.1.1_530.30.02_linux.run
sudo sh cuda_12.1.1_530.30.02_linux.run

注意如果没有管理员模式可以这样,很大程度上行不通。。。

chmod +x cuda_12.1.1_530.30.02_linux.run
mkdir /home/mshw/cuda-12.1/
sh cuda_12.1.1_530.30.02_linux.run

# 如果出现Log file not open. Segmentation fault (core dumped)错误,rm -f /tmp/cuda_installer.log 还是得找管理员
export CUDA_HOME=/home/mshw/cuda-12.1
export PATH=$PATH:/home/mshw/cuda-12.1/bin
export LD_LIBRARY_PATH=/home/mshw/cuda-12.1/lib64

# 下载 https://developer.nvidia.com/rdp/cudnn-archive
tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz

cp cudnn-*12-archive/include/cudnn*.h /home/mshw/cuda-12.1/include
cp -P cudnn-*12-archive/lib/libcudnn* /home/mshw/cuda-12.1/lib64
chmod a+r /home/mshw/cuda-12.1/include/cudnn*.h /home/mshw/cuda-12.1/lib64/libcudnn*

nvcc -V
which nvcc

在这里插入图片描述

在这里插入图片描述 进入options->Toolkit options->记住安装位置 在这里插入图片描述 在这里插入图片描述 换掉老版本 在这里插入图片描述

3.3 设置环境变量

安装完成后,将 CUDA 添加到环境变量中。在 .bashrc 文件中添加以下内容:

export PATH=/usr/local/cuda-12.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH

保存并运行:

source ~/.bashrc

3.4 验证 CUDA 安装

运行以下命令检查是否成功安装:

nvcc -V

在这里插入图片描述

赞(0)
未经允许不得转载:网硕互联帮助中心 » 最新 :服务器的cuda版本太老旧怎么办--cuda安装指南
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!