Ubuntu 24.04 为了实现 secure boot 以及便于管理,将英伟达的驱动打包之后配合 linux modules 实现签名,然后通过 ubuntu-drivers 提供,看起来,一切都很美好。
按照正流程安装:
sudo ubuntu-drivers install --gpgpu
在服务器上安装nvidia-headless-no-dkms-570-server
驱动sudo apt install nvidia-utils-570-server
安装常用软件,包括nvidia-smi
nvidia-smi
查看 GPU 信息不好意思,报错NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running
。
这是因为ubuntu-drivers-common
的包有个不大不小的 bug:只记得安装nvidia-driver-no-dkms-<series>
,忘了安装linux-modules-nvidia-<series>-server-generic
。本来就是no-dkms
,再加上缺少内核模块,注定无法正常工作。
Ubuntu 其实在 2024-10-07 就已经发现这个问题了(1:0.9.7.6ubuntu3.1
),但是直到 2025-03-11 才修复这个问题并重新发布(1:0.9.7.6ubuntu3.2
)。但是,问题又来了,一直被推迟:
The following upgrades have been deferred due to phasing:
ubuntu-drivers-common
至于原因?不好意思,我们分批推送,但是还没有推送,因为还是有问题,已经被暂停并回滚了,至于修复版的修复版,你先等着吧:
ubuntu-drivers-common:
Installed: 1:0.9.7.6ubuntu3.1
Candidate: 1:0.9.7.6ubuntu3.2
Version table:
1:0.9.7.6ubuntu3.2 500 (phased 0%)
500 http://cn.archive.ubuntu.com/ubuntu noble-updates/main amd64 Packages
*** 1:0.9.7.6ubuntu3.1 100
100 /var/lib/dpkg/status
1:0.9.7.6ubuntu3 500
500 http://cn.archive.ubuntu.com/ubuntu noble/main amd64 Packages
为什么这么严重的 bug ,看起来 Ubuntu 并不着急?因为 Ubuntu 的手册上来就让你sudo ubuntu-drivers install
,直接在 server 上安装 xorg/x11 ,附带着把东西全装上,用户就发现不了这个问题了。用户的硬盘跟我有什么关系?我用 snap 在硬盘里面拉了一堆 loop 的屎,不也照样活的好好的,嘻嘻😁。
1
mooyo 21 天前 ![]() 开源的东西不就是这样,要不你就上去修一修呗。
|
2
hwdq0012 21 天前
直接去 ubuntu 官网下载驱动, 反正安装时也是用 gcc 编译了驱动再安装的
|
4
hefish 21 天前
24.04 看起来还是太新了。
|
7
cq65617875 21 天前
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb sudo apt-get update sudo apt-get install cuda-toolkit cuda-drivers -y 请用官方方法 |
![]() |
8
realpg PRO ![]() ubuntu 不着急的原因根本就不是这个
是因为影响用户低于十万分之一 ubuntu server 和 ubuntu 现在几乎已经是完全共版本库和基础机制了 这些机制是给那些 desktop 用户的 方便他们使用 你就是最小众的用法 十万分之一都可能高估了 可能全球用户加起来个位数 而且涉及驱动的问题, 很容易搞崩系统, phase 推进很慢很正常 |