返回

Ubuntu 20.04 安装 cuDNN 9.5.1 for CUDA 12:完整指南

开发配置

1. 环境要求

在开始之前,请确认以下条件:

  • 操作系统:Ubuntu 20.04 或更高版本
  • NVIDIA 驱动已正确安装
  • CUDA Toolkit 12.x 已安装(建议 CUDA 12.1)
  • 确保系统已安装基本工具,如 tarwget

2. 下载 cuDNN

使用以下命令下载 cuDNN 9.5.1 for CUDA 12:

wget https://developer.download.nvidia.com/compute/cudnn/redist/cudnn/linux-x86_64/cudnn-linux-x86_64-9.5.1.17_cuda12-archive.tar.xz

3. 解压 cuDNN 文件

下载完成后,解压文件:

tar -xvf cudnn-linux-x86_64-9.5.1.17_cuda12-archive.tar.xz

解压后,你将得到一个名为 cudnn-linux-x86_64-9.5.1.17_cuda12-archive 的文件夹。


4. 复制 cuDNN 文件到 CUDA 路径

将解压后的文件复制到 CUDA 的对应目录:

cd cudnn-linux-x86_64-9.5.1.17_cuda12-archive

# 复制头文件
sudo cp include/cudnn*.h /usr/local/cuda-12.1/include

# 复制动态链接库文件
sudo cp lib/libcudnn* /usr/local/cuda-12.1/lib64

# 修改文件权限
sudo chmod a+r /usr/local/cuda-12.1/include/cudnn*.h /usr/local/cuda-12.1/lib64/libcudnn*

注意: 如果你的 CUDA 路径不是 /usr/local/cuda-12.1,请根据实际情况替换路径。


5. 验证安装

  1. 检查 cuDNN 版本:
    使用以下命令查看 cuDNN 版本号:

    cat /usr/local/cuda-12.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
    

    输出类似以下内容,表示安装成功:

    #define CUDNN_MAJOR 9
    #define CUDNN_MINOR 5
    #define CUDNN_PATCHLEVEL 1
    --
    #define CUDNN_VERSION (CUDNN_MAJOR * 10000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)
    
  2. 测试深度学习框架(如 PyTorch 或 TensorFlow)是否正常调用 cuDNN:
    在 PyTorch 中验证:

    import torch
    print(torch.backends.cudnn.enabled)
    

    如果输出为 True,表示 cuDNN 已被正确启用。


6. 常见问题

  • 找不到 cudnn.h 文件: 检查是否将头文件复制到了正确的 CUDA include 路径。
  • 动态链接库无法找到: 确保 libcudnn* 文件被复制到 CUDA 的 lib64 路径。
  • 版本冲突: 确认 CUDA 和 cuDNN 的版本兼容关系,可以查阅 NVIDIA 官方文档

7. 总结

通过上述步骤,你已成功在 Ubuntu 系统上安装并配置 cuDNN 9.5.1。cuDNN 的安装是深度学习开发的关键一步,正确的配置将显著提高模型训练和推理的速度。如果有任何问题,请查阅 NVIDIA 的 官方文档 或在社区中寻求帮助。

Happy Coding! 🚀