V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lpdink
V2EX  ›  程序员

兼顾打游戏和训模型的 ALL IN ONE 方案

  •  
  •   lpdink · 1 天前 · 2503 次点击

    50 系在即,准备重新装机,在纠结系统方案了。主要需求是打游戏,写代码( C++/Java)和训模型(cuda )。

    现在是宿主机装 windows11 ,WSL 下训模型和写代码的方案。但是 WSL 的环境,尤其是 GPU 环境很容易炸,N 卡驱动更新,WSL 更新都可能破坏宿主机或宿主机内容器的 GPU 环境,总归和原生 linux 不一样,听说也会损失 10%的 GPU 性能,很难受。

    另外对系统备份和还原也有需求,很想用虚拟机了。

    前段时间听说了 PVE ,感觉很不错,但是试了下发现 Geforce 系列显卡没法做 GPU 虚拟化,只能直通给某个虚拟机,这样直通给 windows 就没法训模型,直通给 linux 就不好打游戏了。

    老哥们现在用的是什么 all in one 方案?有没有什么好办法,充分利用上那张很贵的显卡?

    41 条回复    2024-11-30 13:54:25 +08:00
    wheat0r
        1
    wheat0r  
       1 天前
    我觉得打游戏和 AIO 根本不配套
    bigtear
        2
    bigtear  
       1 天前
    没有好办法,你要想一个系统兼顾打游戏和训练模型,ALL IN Linux 是最佳选择,能打游戏又能方便训练。Windows 训练的性能会稍差。

    PVE 的话,显卡直通 Linux 训练,再买一块显卡插上直通 Windows 打游戏,一台主机兼顾两个需求了。
    visitant
        3
    visitant  
       1 天前
    PVE 显卡直通,打游戏切到 Windows ,训练切到 Linux ?
    RightHand
        4
    RightHand  
       1 天前 via Android
    待机功耗 200w 能接受不???
    a302800411
        5
    a302800411  
       1 天前 via iPhone
    搞多个启动盘不行吗,一块 ssd 装 Windows ,一块装 Linux 。搞个引导管理器,每次开机决定进入哪个系统
    txhwind
        6
    txhwind  
       1 天前
    双系统呗,总不会一边打游戏一边跑训练吧
    baysonfox
        7
    baysonfox  
       1 天前
    如果只对 linux 有备份还原需求感觉可以直接双系统,linux 侧用 btrfs/zfs 做快照备份
    wxd21020
        8
    wxd21020  
       1 天前
    @visitant 细说切显卡
    lerry
        9
    lerry  
       1 天前
    我现在是两块 ssd ,Windows 和 Linux 各自一块盘,装系统的时候只插一块盘。

    哪个用的多默认启动哪个,开机可以选系统
    Biem
        10
    Biem  
       1 天前   ❤️ 2
    可以训练模型打游戏,这样就兼顾了()
    esee
        11
    esee  
       1 天前
    如果你是想用显卡在 win 打游戏 输出画面的同时在 linux 下训练 cuda,那确实办不到,但是如果你是想串流,那完全可以,40 系显卡破解后也能虚拟化, 虚拟后同时给 linux 和 win 用,只是 win 无法输出画面,你用串流的话就可以。如果是不需要同时进行,那更简单了。打游戏的时候直通给 win ,训练的时候直通给 linux ,那不就得了
    xuelu520
        12
    xuelu520  
       1 天前
    先说预算,没预算咋给你兼顾
    reatang
        13
    reatang  
       1 天前
    用 GRUB2 自己做双系统呗
    Jinnrry
        14
    Jinnrry  
       1 天前 via iPhone
    Windows in PVE 有些游戏检测虚拟机,根本过不了风控
    WuDiHaiTai
        15
    WuDiHaiTai  
       1 天前
    @Jinnrry 可以通过修改 conf 规避虚拟机检测,办法很多的。
    wangyzj
        16
    wangyzj  
       1 天前
    嘿,我在想这个问题想了好几天了,没啥特别好办法
    单显卡肯定不可能双活,那就只能双系统,双系统就没啥必要 pve ,直接上 vmware 开一些必要的 vm 就好
    当然最好还是俩显卡,但穷
    总之没啥完美方案
    lpdink
        17
    lpdink  
    OP
       1 天前
    @txhwind @baysonfox 主要是 N 卡配 linux 桌面特别容易爆炸,之前折腾过两次,每次都是更新下驱动,桌面炸了进不了系统....也可能是我对 linux 桌面不熟悉,好不容易搞好驱动,输入法,星火商店,桌面主题美化什么的,重启一下发现爆炸了...爆炸了...两个小时白折腾了。还蛮喜欢 gnome 的
    lpdink
        18
    lpdink  
    OP
       1 天前
    @visitant 老哥,能指点下怎么 PVE 显卡直通下,动态或方便地切换直通的系统吗?
    lpdink
        19
    lpdink  
    OP
       1 天前
    @bigtear 也不是没有钱买多块显卡,但是多买一块 5090 的话,就会想着拿两张 5090 一起训模型了...不然总觉得很可惜
    cbythe434
        20
    cbythe434  
       1 天前
    macbook m4 128G
    Carson089
        21
    Carson089  
       1 天前
    不要折腾了。爱玩游戏就好好挑个游戏本,显卡够用最低配就行。 训练模型,笔记本的阉割版显卡完全不够用,分分钟烫手。mac 不用考虑了,玩游戏不行,玩大模型一般部署 int4 甚至 int1 的大模型,准确率差很多的。
    玩大模型就去租用服务器就行,弹性扩展,千问 72B 都可以玩,还可以分部署训练,这是单卡无法比拟的
    yazinnnn0
        22
    yazinnnn0  
       1 天前   ❤️ 1
    直接装 linux, 现在用 proton 打新游戏已经很成熟了, 有的甚至比 windows 下效果还好

    比如黑🐒在 protondb 上都是白金效率
    https://www.protondb.com/app/2358720

    &ab_channel=A1RM4X
    coldle
        23
    coldle  
       1 天前 via Android
    不如说说你打什么游戏,常规 steam epic 游戏在 linux 运行效率都还可以,你要是懒得折腾 N 卡驱动,直接装 bazzite 这种发行版都可以
    coldle
        24
    coldle  
       1 天前 via Android
    @coldle #23
    bazzite 在 N 卡下除了 gamescope 用不了,其他应该都属于开箱即用。不过 50 刚出来的时候驱动是否能及时跟上我还真不确定
    lbp0200
        25
    lbp0200  
       1 天前
    wsl 下显卡性能损失 10%,又不是什么大问题,就是开发调试
    zuotun
        26
    zuotun  
       1 天前
    @esee #11 显卡怎么虚拟化?我记得从 30 系开始就不支持了啊
    impdx
        27
    impdx  
       1 天前   ❤️ 1
    显卡直通吧,俩块显卡就行了。pve 或者 exsi 。我是习惯 exsi 了。unraid 也可以。不过注意虚拟化的 win10 打游戏要过反作弊的虚拟化检测,所以你大概率还要直通 cpu 核心,直通一堆。还需要改很多配置文件。当反作弊一更新又要改。。。

    所以我的建议是!买一台 dell r430/720 这类 2u 服务器,上暴力风扇,不会太贵,准系统就够了。

    折腾 pve 和 allinone 的时间和金钱,可能不如分开来的省钱。

    我以前也是 all in one 。unraid ,单显卡直通 win 打游戏。直到抛弃了 3950x ,换了 x3d ,打游戏真爽。直接 2000 多买了一台 r430 ,不带显卡。
    impdx
        28
    impdx  
       1 天前
    虚拟化 gpu 要授权。特殊显卡比如 grid 的驱动就可以虚拟化。一般不用考虑了。正常要虚拟化 gpu 只能 hyperv 。单 hyperv 这玩意吧。。。
    dayeye2006199
        29
    dayeye2006199  
       1 天前 via Android
    Steam on linux
    m1nm13
        30
    m1nm13  
       1 天前
    你装个双系统不就完了
    blacktail
        31
    blacktail  
       1 天前
    消费级显卡不支持 vgpu ,网上的方法要不过时了,要不就是用扭曲的方式解决。所以又要训练又要玩游戏最省心的是插两张卡,除了费电都挺好。
    Donaldo
        32
    Donaldo  
       1 天前
    痛点都被你列完了,真的不如去租算力。。。
    MartinYANG06
        33
    MartinYANG06  
       1 天前
    装个双系统呗, 该打游戏打游戏, 该训练模型训练模型。
    整个软路由,弄个 ssh 端口映射,远程连接家里的电脑搞开发训练模型,省的每次租 gpu 服务器和配置环境麻烦。
    neilyoone
        34
    neilyoone  
       23 小时 11 分钟前   ❤️ 1
    试试 系统装 Ubuntu 桌面版, KVM 搞 Linux/Windows 虚拟机.
    显卡直通给 Windows 虚拟机, 然后其他设备串流到 Windows 打游戏.
    不打游戏的时候, 关闭 KVM, Ubuntu 下就能把显卡用起来跑训练.
    neilyoone
        35
    neilyoone  
       23 小时 10 分钟前
    忘了说, 我的设备就是这样搞的
    nrtEBH
        36
    nrtEBH  
       22 小时 28 分钟前
    搞个游戏主机 模型什么的租云资源就好了
    ShadowPower
        37
    ShadowPower  
       19 小时 57 分钟前   ❤️ 1
    其实在 WSL 下训练的模型越大,性能损失越小,NVIDIA 的博客里有相关细节:
    https://developer.nvidia.com/zh-cn/blog/leveling-up-cuda-performance-on-wsl2-with-new-enhancements/

    我以前用 Linux 环境,然后发现折腾 Linux 串流游戏问题更多……
    在某一天,部署好的 VNC 服务不知道为什么死活连不上了,然后回到了 Windows+WSL 。

    装好就禁用 Windows 更新,并且除非有明确的理由(更新驱动可以解决目前遇到的问题),否则驱动也不更新。
    用 WSL 顺便还解决了备份还原的问题,也不用折腾 Linux 驱动了。
    swulling
        38
    swulling  
       19 小时 50 分钟前
    感觉很多人都在说 xx 环境「炸」。

    不管是 WSL 也好,Linux Desktop 也好,软件上很难见到莫名其妙故障的,熟悉环境,也没啥问题。
    lpdink
        39
    lpdink  
    OP
       19 小时 18 分钟前 via Android
    @swulling 更新会引入问题的,老哥。我怀疑 wsl 的稳定性主要是因为这个 issue 。虽然是两年前提的了,但今年隔三差五还有人 @我...https://github.com/microsoft/WSL/issues/9962
    这次后就想着要换原生 linux 了的
    bluearc
        40
    bluearc  
       6 小时 50 分钟前
    30 系和以前的消费级显卡可以用 vgpu_unlock 解锁虚拟化,解决你的所有问题,但看你似乎想上 50 系?如果只有打游戏和训练、部署模型的需求,没有需要持久运行的服务,那还是老实用双系统吧;要么就在 win 上凑合用 wsl ,要么在 linux 上打游戏,其实这两个也很成熟了
    ISVStar
        41
    ISVStar  
       4 小时 50 分钟前
    @lpdink wsl 套 docker 确实会有问题,特别是网络。不套 docker 就行
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2624 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 10:45 · PVG 18:45 · LAX 02:45 · JFK 05:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.