您可根据如下操作步骤自行安装Tesla驱动,如要安装CUDA工具包请参见安装CUDA工具包,如要安装cuDNN加速库请参见安装cuDNN加速库。
前提条件
GPU云主机未安装驱动。
GPU云主机配备弹性IP。
一 、CentOS/CTyunOS/Kylin操作系统驱动安装
下载Tesla驱动
建议根据Tesla驱动及相关组件版本兼容指南选择合适的驱动版本。
下载对应驱动。访问NVIDIA驱动下载官网,选择对应GPU型号、操作系统和CUDA Toolkit版本后,进行下载,本文以 A100 为例,如下图所示。

点击搜索,选择要下载的驱动版本,点击下载。

安装Tesla驱动
将下载的驱动安装包上传到云主机中,执行以下命令,对安装包添加执行权限。例如,对文件名为NVIDIA-Linux-x86_64-470.199.02.run添加执行权限。
chmod +x NVIDIA-Linux-x86_64-470.199.02.run安装kernel-devel、gcc包,注意kernel-devel版本要和内核版本保持一致。
sudo yum install -y gcc kernel-devel执行以下命令,运行驱动安装程序,并按提示进行后续操作。
sudo sh NVIDIA-Linux-x86_64-470.199.02.run --disable-nouveau --kernel-source-path=/usr/src/kernels/$(uname -r)安装完成后,执行以下命令进行验证。
nvidia-smi如返回信息类似下图中的 GPU 信息,则说明驱动安装成功。

GPU驱动开启持久化模式
Persistence-M(Persistence Mode)是一个用户可设置的驱动程序属性的术语。启用持久性模式后,即使没有活动的客户端,NVIDIA驱动程序也会保持加载状态。这样可以最大程度地减少与运行依赖的应用程序(例如 CUDA 程序)相关的驱动程序加载延迟,同时减少GPU云主机掉卡问题的发生。
cd /usr/share/doc/NVIDIA_GLX-1.0/sample* bunzip2 nvidia-persistenced-init.tar.bz2 tar xvf nvidia-persistenced-init.tar cd nvidia-persistenced-init && sh install.sh -u root
二 、Ubuntu操作系统驱动安装
下载Tesla驱动
建议根据Tesla驱动及相关组件版本兼容指南选择合适的驱动版本。
下载对应驱动。访问NVIDIA驱动下载官网,选择对应GPU型号、操作系统和CUDA Toolkit版本后,进行下载,本文以 A100 为例,如下图所示。

点击搜索,选择要下载的驱动版本,点击下载。

安装Tesla驱动
将下载的驱动安装包上传到云主机中,执行以下命令,对安装包添加执行权限。 例如,对文件名为NVIDIA-Linux-x86_64-470.199.02.run添加执行权限。
chmod +x NVIDIA-Linux-x86_64-470.199.02.run安装gcc和linux-kernel-headers。
sudo apt-get install gcc linux-kernel-headers执行以下命令,运行驱动安装程序,并按提示进行后续操作。
sudo sh NVIDIA-Linux-x86_64-470.199.02.run --disable-nouveau安装完成后,执行以下命令进行验证。
nvidia-smi如返回信息类似下图中的 GPU 信息,则说明驱动安装成功。

GPU驱动开启持久化模式
Persistence-M(Persistence Mode)是一个用户可设置的驱动程序属性的术语。启用持久性模式后,即使没有活动的客户端,NVIDIA驱动程序也会保持加载状态。这样可以最大程度地减少与运行依赖的应用程序(例如 CUDA 程序)相关的驱动程序加载延迟,同时减少GPU云主机掉卡问题的发生。
cd /usr/share/doc/NVIDIA_GLX-1.0/sample* bunzip2 nvidia-persistenced-init.tar.bz2 tar xvf nvidia-persistenced-init.tar cd nvidia-persistenced-init && sh install.sh -u root
三 、Windows操作系统驱动安装
下载Tesla驱动
建议根据Tesla驱动及相关组件版本兼容指南选择合适的驱动版本。
下载对应驱动。在云主机内访问NVIDIA驱动下载官网,选择对应GPU型号、操作系统和CUDA Toolkit版本后,进行下载,本文以 A100 为例,如下图所示。

点击搜索,选择要下载的驱动版本,点击下载。

安装Tesla驱动
打开下载驱动程序所在的文件夹,双击安装文件开始安装,按照界面上的提示安装驱动程序并根据需要重启GPU云主机。
安装完成后查看设备管理器,显示如下则表示驱动安装成功。
