三者有区别吗?
具体来说:我平时安装的是第一个 NVIDIA Container Toolkit for Docker 。目的是在容器内能够使用宿主机的 GPU 。安装完成后可以:
现在的问题就是上面三者的安装过程都不相同,被搞晕了不知道有什么区别
1
isno 334 天前
我从名字里面猜,不一定对,你参考一下。
1. NVIDIA Container Toolkit 应该是为 Docker 开发的 GPU 驱动,Docker 配合这个才能使用 GPU 2. NVIDIA Docker 貌似是 NVIDIA 扩展后 Docker 版本。安装它可以直接使用 GPU 3. Container runtime 猜测是添加了 GPU 硬件支持的运行时实现。可以让上层的容器引擎( docker )或者容器编排系统( k8s )使用 |
2
paidaxtis OP |
3
isno 334 天前
|
4
YsHaNg 334 天前
3 包括驱动和 1 host 或者自己装驱动 cuda 等就不需要 我是 wsl 里用 特别注意只要装 Windows 驱动 wsl 里装 NVIDIA Container Toolkit for Docker only 2 是 docker image
|
6
paidaxtis OP @YsHaNg 所以应该是:
1. NVIDIA Container Toolkit for Docker 是带驱动完整的让容器使用 GPU 的环境。 2. NVIDIA Container runtime 是分布式的 NVIDIA Container Toolkit for Docker ,装上以后将 NVIDIA Container Toolkit for Docker 作为 host 。 3. NVIDIA Docker 仅仅是一个镜像,分不同的 CUDA 和 CUDnn 这样理解对吗? |
9
YsHaNg 333 天前
@paidaxtis 然而现在需要装 nvidia-container-toolkit😂 前提是 docker 够新 k8s+旧版 docker 还要用旧的 nvidia container runtime 它是个 runc 的重写复制品 nv 把 code base 挪到 https://gitlab.com/nvidia/container-toolkit/container-toolkit/-/tree/main/cmd/nvidia-container-runtime 了 总之现在需要的是安装驱动 安装 nvidia-container-toolkit 启动 nvidia/cuda image 配置的话我用 wsl2 只需要启动参数加--gpus
|