V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Saunak
V2EX  ›  Local LLM

家用 AI 开发机, GPU 在“魔改 4090 48G”和“等 5090 32G”之间纠结,求大佬们给点建议!

  •  
  •   Saunak · 23 天前 · 2627 次点击

    实验室有卡,但是要排队,很多开发和测试不方便(租卡迁数据更不方便)。计划配一台家用的 AI 开发机,主要是跑 7B-32B 的 LLM 。因为住在租的房子里,所以对噪音和散热比较敏感。目前预算先上一张卡,未来可能升级双卡。现在对 GPU 的选择非常纠结,想听听大家的意见。

    一、GPU 选择:核心纠结点

    选项 A:魔改版 RTX 4090 48GB

    优点: 显存巨大 (48GB) 多卡兼容性:wsl2 下似乎可以多卡?只需要消费级主板? 顾虑: 散热/噪音:涡扇版据说噪音巨大,不适合家用。可能要三风扇或水冷版。水冷长期可靠性(漏液风险)没底。 质保风险:没有官方质保,完全依赖店铺。看到有人炸缸,店铺进行了更换,但需要提供温度记录之类。

    选项 B:RTX 5090 32GB

    优点: 性能更强:下一代架构,核心性能肯定提升巨大。 家用友好:散热和噪音控制肯定比魔改方案好,适合家庭环境。 顾虑: 显存稍小 (32GB) 兼容性:看到有说法是“老模型可能用不了” 多卡兼容性:wsl2 下好像完全无法兼容多卡。且需要服务器级主板

    我想问的问题:

    1. 为了处理 32B 模型,48GB 显存的优势是否大到值得去承担魔改卡的散热、噪音和质保风险?
    2. 有没有用过这类魔改大显存卡的兄弟,能分享一下实际的稳定性和使用体验吗?
    3. 后续希望可以直接在原机器上直接加卡,拓展成双卡。最好是 win 下能用,实在不行就换 ubuntu 系统。这种情况下 5090 和 4090 改哪个合适一点?

    二、主板考量:未来可能升级双卡

    想问的问题:

    1. 如果未来要上双卡(无论是两张 4090 还是 5090 ),主板选择上有什么关键点?
    2. 我看到一个说法是“5090 双卡需要两个 PCIe 5.0 插槽”,这个是必须的吗?还是说带宽足够的 PCIe 4.0 主板(比如能支持双 x8 模式)就够用了?
    3. 除了带宽,主要是不是应该关注两根 PCIe x16 插槽之间的物理空间,以保证两张卡的散热?

    感谢各位的宝贵时间和建议!

    55 条回复    2025-10-31 11:21:45 +08:00
    Ritter
        1
    Ritter  
       23 天前
    要我选肯定 5090
    bigtear
        2
    bigtear  
       23 天前
    看你的需求,感觉懒猫 AI 算力舱挺适合你的,我日常跑 qwen 和 comfyui 还可以,如果感兴趣可以搜一下,他们客服挺活跃。
    bigtear
        3
    bigtear  
       23 天前
    如果不是刚需,建议等,因为接下来肯定各家都要上大显存的设备
    shenqi
        4
    shenqi  
       23 天前
    如果一定选,建议 5090 ,后续升级显卡卖出去更值钱。这个是从经济角度的。
    HenryHe613
        5
    HenryHe613  
       23 天前
    32B 可以用 5090 32G 跑,所以 48G 和 32G 对你来说差别不是很大。
    目前没有遇到老模型用不了的问题,只是 PyTorch 需要用 nightly 渠道安装,不然会不支持 5090 的驱动。
    5090 非国行也没有保修,我是去日本旅游顺路带了一张回来自己用。但是相比 4090 改装版,我觉得原厂的质量更加可以信赖。
    如果后期需要上双卡,记得电源预留点空间,这样后期升级可能会节省一笔费用。1000W 以上的电源可不便宜。
    sunny352787
        6
    sunny352787  
       23 天前
    不考虑 A6000 ada 这类专业图形卡吗?相当于官方的 4090 48G ,5090 的价格都能接受了那 A6000 也没差太多了
    Saunak
        7
    Saunak  
    OP
       23 天前
    @sunny352787 A6000 和 A6000 ada 是两种哇。服务器用的就是 A6000 ada ,那个太贵了,一张要 5w 多
    robbaa
        8
    robbaa  
       23 天前
    双 3090+nvlink 先用着,后期再说后期的问题,到时候说不定 6090 都出来了
    sunny352787
        9
    sunny352787  
       23 天前
    @Saunak 我知道是两种,不过现在 5090 满血版能买到吗?要是不好买的话魔改版 4090 还是不太放心,所以我想不如考虑 A6000 ada ,但确实有点贵哈哈哈哈
    jiujiutang
        10
    jiujiutang  
       23 天前
    这篇文章的思路也可以参考下。https://mp.weixin.qq.com/s/vIrvbVJ6Nv00Ehre1zZwMw
    Quik
        11
    Quik  
       23 天前
    就从我自己了解的部分来回答部分问题以及一些建议:
    1. 除非你租房有专门放机箱的房间,否则没办法用涡轮卡;
    2. 关于显卡需求的 PCIE 通道:5090 理想情况下是需要 PCIE 5.0 * 16 的,但是 PCIE 5.0 *8 也有人说损失很小。4090 需要 PCIE 4.0*16 就行,也就是 PCIE 5.0*8 的速度,不过不知道 PCIE 4.0 * 8 有多少损失。
    3. 主板选择:首先确认是 msdt 还是 hedt 。
    - 家用主板对多卡的支持性很差,但也有少部分选择(虽然性价比不高)。这种情况下需要找专门能支持显卡 PCIE 拆分的主板,将 1 个 PCIE 5.0 * 16 拆分成两个 PCIE 5.0 * 8 。用 AMDcpu 的话,微星的 800 系主板只能看一下 X870E Godlike ,或者再等等后面出的 X870E Ace 。600 系主板便宜的选择是 X670E 暗黑,除了内存支持略弱其实扩展性更好一点,这块板子可以看做最便宜的支持双 PCIE5.0*8 的主板,但是给显卡的第一个 PCIE 插槽在第 3 槽,导致物理空间拥挤。或者看看 Intel 的主板也行,虽然 CPU 稀烂并不推荐。
    - 服务器的话我想到的是 7K62 这种洋垃圾,看起来也还行,主板也不算贵,至少 PCIE 通道很多(基本上都是 PCIE*4.0 *16 ,所以不需要担心通道不够,相对应的也没有物理空间问题。
    4. 关于显卡的物理空间:5090 风冷基本上都是 3 槽及以上的,两张超厚风冷卡并排其实散热不太好,吃尾气。关于物理空间不够用(例如两个拆分后的显卡 PCIE 插槽只有 3 槽),可以用 PCIE 延长线的。
    5. 考虑双卡基本上都得上超大机箱了,例如追风者 PK620 这种的。当然机架式的也不是不行。
    KimGuo
        12
    KimGuo  
       23 天前
    最近听说有个方案,是把两块 v100 16GB 通过转换器转成一个 PCIE (两个 x8 )然后通过软排线接到主机上的方案
    好处是便宜(咸鱼成品大概是 2800 )
    坏处是需要主板支持通道分割、v100 不支持 fp16 运算(不兼容一些新的推理模型)、个头不小
    Saunak
        13
    Saunak  
    OP
       23 天前   ❤️ 1
    电源和机箱这个问题倒是不大。
    主要是主板和系统不太了解。我看很多测评说 5090 需要双 PCIE5.0 x 16 ,一般的消费级主板带宽不够会导致双卡速度非常低。https://zhuanlan.zhihu.com/p/1906986288147563035

    看到可行的方案有 GIGABYTE TRX50 AI TOP + AMD 线程撕裂者 7960X ,不晓得有稍微便宜点的没。
    []( https://www.xiaohongshu.com/explore/67f3f894000000000f03be93?xsec_token=ABrHcV3PAqG0pzB8e4RojCRGvBJJYysnPQtFynCnUYn0Y=&xsec_source=)
    Saunak
        14
    Saunak  
    OP
       23 天前
    @sunny352787 5090 和 5090 D 测试好像差别不大吧?只要不是 24G 的版的。
    我看其他平台很多推荐 4090 48G 的,不知道是卡贩还是啥。这个帖子倒是清一色的推荐 5090
    Saunak
        15
    Saunak  
    OP
       23 天前
    @Quik 谢谢这么详细的分享。
    看到可行的方案有 GIGABYTE TRX50 AI TOP + AMD 线程撕裂者 7960X 。
    https://www.xiaohongshu.com/explore/67f3f894000000000f03be93?xsec_token=ABrHcV3PAqG0pzB8e4RojCRGvBJJYysnPQtFynCnUYn0Y=&xsec_source=

    我想问下如果用 5090 双卡的方案(非水冷),我后期自己加卡。那么现在的主机是找 jd ,tb 的供应商定制,还是自己 diy ,或者买了找 jd 装机的人装比较好?

    jd 和 tb 的供应商,我看似乎配置都不太灵活,而且价格会高不少,不晓得他们的售后有没有用
    Quik
        16
    Quik  
       23 天前
    @Saunak #15 我的看法:
    1. 个人买 5090 约等于没有售后(包括但不限于店保、白牌等),供应商之类的也不好说,这方面就是买别怂,怂别买。不过显卡这种东西是不拿来折腾的,我拿到手之后测了一天的甜甜圈什么的,温度也不是很高,切到 Ubuntu 之后赶紧加上了 450W 的功耗限制。就算是真坏了也有 B 站张哥和靓女能修。最常见的坏法就是少接口,搬板也就 2-3k ,其实成本没有想象的高(只要核心没坏)。
    2. 供应商的售后,个人买还真不了解。但是同学之前了解过官方采购那种途径(就是 30W 以下的单位采购,无须招标,可开票),当时听说是坏了包修 or 换,供应商说是有到 SG 的途径去修卡或者售后卡。缺点是性价比低,你需要用旗舰卡的价格买丐卡。
    3. 实在担心售后,考虑一下 5090D ?好像 5090D 相对于 5090 就阉割了 FP4 ,对 99%的场景都是暂时用不到。一般自己 fine-tune 都至少是 fp16 或者 bf16 吧。不过也有人说 5090D 的核心已经停产,即便是核心出问题售后也是有去无回,而且一些显卡品牌的售后还不怎么样(比如微星),或者你 5090D 拿去售后给你换成 5090Dv2 ,什么说法都有。至少现在有小问题还是都能给解决的。

    我个人是就用了 1 张 5090 (微星的神龙)。温度也不会多高,个人感觉 3 年很难用坏。
    panxi
        17
    panxi  
       23 天前
    @KimGuo v100 架构太老了, 公司搞了三张 v100 把我折磨的够呛
    sunmacarenas
        18
    sunmacarenas  
       23 天前
    可以看下 rtx5880ada ,价格与 5090 差不多,显存是 48G
    coefu
        19
    coefu  
       23 天前
    你不给预算怎么推荐?如果只是跑 LLM ,不做别的,那我推荐 Mac studio M3 pro 。 你会发现,仅仅是放在住处,这是多么睿智的选择。如果你有类似于 IDC 的环境,自己组装台式机+GPU 是个好选择。
    coefu
        20
    coefu  
       23 天前
    @KimGuo 那都是去年的方案了。
    coefu
        21
    coefu  
       23 天前
    @coefu #19 fix: Mac studio M3 ultra.
    Saunak
        22
    Saunak  
    OP
       23 天前
    @coefu jd 上整机我看双卡大概 5-6w 吧。我目前 3-4w 预算
    cpstar
        23
    cpstar  
       23 天前
    不是有一个 GB10 的各家小主机
    coefu
        24
    coefu  
       23 天前
    @Saunak #22 GPU 主要是保值,但是关键问题,你要放住处,那就难搞,但凡组的 GPU 台式机,第一,功耗高,第二热量和噪声大,这个是会影响到生活的。mac studio ultra 的情况是,如果你统一内存买小了,后续不怎么保值,你要是再出手估计要打折。对于你的问题来说,我觉得 mac studio ultra 是最优解。
    coefu
        25
    coefu  
       23 天前
    @Saunak #22 4090/5090 单卡功率 595w ,2 张就要 1200w ,带上主板 CPU ,电源按照转换率 80%起码要买 2500w ,跑满的时候,一个小时 2.5 度电,你遭的住?不要小看这个啊,电表倒转。
    coefu
        26
    coefu  
       23 天前
    @coefu #25 mac studio m3 ultra 最大持续功率:480 瓦,工作温度:10°C 至 35°C (50°F 至 95°F)。对于放到住处,过来人的经验。
    FakerLeung
        27
    FakerLeung  
       23 天前
    多 I 卡试试?
    mayday1997
        28
    mayday1997  
       23 天前
    @bigtear 这个平台有 nfsw 审查吗
    mayday1997
        29
    mayday1997  
       23 天前
    @bigtear 抱歉,查了下不是平台,打扰了
    bigtear
        30
    bigtear  
       23 天前
    @mayday1997 #28 整机,和 Mac Studio 差不多
    propheteee
        31
    propheteee  
       22 天前 via Android
    英伟达新出的针对个人开发者的 DGX Spark 考虑下不,128g 共享内存
    Saunak
        32
    Saunak  
    OP
       22 天前
    我是用来开发和调试的,需要进行一定的训练,但是不会完全在自己的机器上跑。mac studio ultra 好像主要是推理吧?
    双卡主要是预留,后面如果有需求扩展 gpu 就不浪费之前的机器了。双卡不一定是刚需。
    如果不拓展我就当做高性能主机用了。
    租房有单独的卧室,只是办公和机器要在一起。
    8355
        33
    8355  
       22 天前
    现在普通成色的 4090 卖给一般消费者,好成色的都在机房出租
    肯定是买新不买旧
    Saunak
        34
    Saunak  
    OP
       22 天前
    @8355 这样哇,4090D 也一样么?
    我看 xhs 推荐 4090 48G 的还不少,都是卡贩?
    HenryHe613
        35
    HenryHe613  
       22 天前
    @Quik #16 为什么你的微星神龙只有 450W ?我的超龙有 600W ?你是自己限制了功耗吧
    Quik
        36
    Quik  
       22 天前
    @HenryHe613 #35 自己限制的,怕 600W 烧接口。主要是 Linux 下没有 Afterburner 这种工具能够调整电压/频率曲线,只能限制一下总功耗规避一下风险。限制功耗性能比 4090 还略微强一点。
    mystical
        37
    mystical  
       22 天前
    @Quik 限制功耗为啥不买 4090 呢? 4090 还有保。难道说 4090 和 5090 一样价?不至于吧。(手持 4090n 年了)
    Quik
        38
    Quik  
       22 天前
    @mystical #37 现在没有全新的 4090 了吧,要么是二手,要么是 4090 48G 。前者大概一万七,后者两万+,跟 5090 差不多的价格。4090 早就不是以前一万二左右价格的时候了
    Saunak
        39
    Saunak  
    OP
       22 天前
    @Quik 4090/D 48G 这种一般也是二手改的吧?
    5090 烧接口好像是最开始的那批?现在还烧吗? 5090D 会不会没那么容易烧?
    Quik
        40
    Quik  
       22 天前
    @Saunak #39 一般都是二手改的,所以我有些信不过。
    5090 和 5090D 少接口差不多,本质上是功率高+这个接口设计垃圾没有均流导致的,没有太多好的办法。不过烧接口毕竟是少数,应该问题不大。

    防止的话:
    1. 保证接口插紧,windows 下可以通过跑甜甜圈+监控一下 12v 的电压(具体忘了,B 站有教程)。
    2. 另外这个接口的插拔次数的寿命很少,不要过多的插拔,次数多了就该换线。
    3. 线缆尽量不要弯折,尤其是靠近机箱侧板的部分,有条件的话可以先用 90 度接口的线(部分电源厂商会提供售卖,例如首席玩家)。
    4. 微星的 5090**绝对不要用**显卡自带的那根双色线,烧过好多了。尽量用电源附带的线。https://www.bilibili.com/video/BV1C8x1zSE2Z/
    BingoW
        41
    BingoW  
       19 天前
    我也不太懂,你说的处理 32B 是微调吗,我家 2080TI 22G 魔改版本 也能跑 千问 32B 大模型 速度是 20 多 token/s 微调的话,我理解你这两款显卡都可以,看性价比,以及后续升级多卡匹配性。如果上来就考虑多卡方案,机箱先选个支持的吧,我想玩双卡魔改 2080 ,但是我机箱就一个显卡位。
    Saunak
        42
    Saunak  
    OP
       18 天前
    @BingoW 4090 多卡倒是没什么问题,就是卡本身可能是旧卡,质量风险大。5090 的多卡比较复杂,不知道能不能行。

    后期如果再考虑双卡可能有点浪费前期买的主板和电源。这么考虑也是情况有点特殊,算是转行在弄这个,不确定后面有没有公家的卡可以用,所以要自己做项目的话,还是双卡可能方便点
    BingoW
        43
    BingoW  
       18 天前
    @Saunak #42 我也学习了,魔改肯定都是旧卡翻新,有的翻都不翻了,改个显存啥的。找个靠谱卖家,质保个一年啥的一般没啥问题。
    Saunak
        44
    Saunak  
    OP
       8 天前
    @Quik

    大佬,我研究了一下,最后还想请教下。

    感觉核心需求是支持双显卡槽直通拆分 PCIE 5.0 * 16 拆分成两个 PCIE 5.0 * 8
    最好能支持 DDR5 * 4

    在满足上述核心性能需求的情况下,可以考虑价格低的:
    1 CPU 和 主板 选哪个呢?
    2 电源是 1600W 还是 2200W 呢?
    3 耕升 GeForce RTX 5090 D 炫光 OC 32G 京东的行么?(客服说可以保修)
    4 这个主板应该能插的进双卡 5090 吧?

    主板 华擎 X870E TaiChi/X870E HERO/PROART X870E
    电源 长城黑匣子 2200W
    CPU AMD 9950X3D/9950X/9900X3D
    散热器 瓦尔基里 B360 一体式水冷
    内存 96GB(48GB*2)
    机箱 追风者 PK620 工作站版
    显卡 耕升 GeForce RTX 5090 D 炫光 OC 32G

    @Quik
    Quik
        45
    Quik  
       7 天前
    @Saunak #44 并非大佬,哈哈~
    其实现在并不是一个特别好的时间来 DIY 电脑。一方面最近内存大涨价,另一方面 AMD 明年的 zen6 新 U 好像性价比更高(现在 9950X 只是 16C32T ,明年新 U 据传是 24C48T ,而且配套的新系列主板)。

    如果非要现在买的话:
    1. CPU 和主板的购买个人建议:
    关于 CPU:你需要评估一下 X3D 对你有没有用,我个人觉得 AI 是不需要 X3D 的,所以考虑成本 9950X 足矣。

    关于主板:
    - 华擎的太极是最便宜的 X870E 旗舰板,但前段时间华擎有烧 U 的新闻( CPU 底座烧毁),而且 BIOS 更新较慢,约等于没有售后(毕竟是越南擎);
    - X870E HERO 是华硕的,这代华硕的主板说是会咬显卡的 PCIE 金手指,换新版之后据说效果也不太行; PROART 不知道是不是也一样,不介意这一点华硕的板子没什么问题。
    - 也可以关注一下微星的 X870E (不知道 Ace 出了没有),之前微星允许双 X8 的只有 Godlike ,似乎新的 X870E Ace 也会支持这个特性。推荐微星的原因是微星这代对内存的支持特别好,插满 4 条很简单就能启动,符合你对“支持 DDR5 * 4“的需求。(我自己的是 X670E 暗黑,更新 bios 之后,用的内存条是 64 *4 ,设置好 EXPO 一次性启动成功,就是自检略长,800 系主板原则上兼容性比 600 系还要好)。

    以上主板不只是要看能否支持 PCIE * 8 拆分,还要看两个支持拆分的 PCIE 插槽的槽位距离。我没有具体的插槽距离数据,看别人的视频( https://www.bilibili.com/video/BV1YSe7zkEDu/)感觉太极和 Hero 的间距是够的,如果不放心最好问问客服或者找找其他确定来源(例如看看别人的装机视频,对比机箱屁股或许可以看到相聚几个槽位)安全的话最好有 4 槽。

    2. 关于电源,既然你都问了,那我肯定推荐 2200W ,冗余多一些(只是从功率角度推荐,没有细看电源的做工)。1600 感觉凑活够(很多人单个 5090 就用的 1000w ,再加额外一个 5090 的功耗刚好是 1600w )。

    3. 跑 AI 的话,5090D 是完全没问题的。现在怕的是 AIC 各种吃相难看,如果核心坏了,你找官方售后会告诉你没有备件(因为 5090D 的核心已经停产了),然后**可能**给你换成 5090Dv2 (显存变成 24G )。当然这个只是大家的推测,毕竟也没有见到实例。如果只是其他的小部件坏了官方修好肯定是没啥问题的。所以从这个角度看也算是可以买?不过你从京东买最好是自营,不然和第三方店铺以及淘宝没有任何区别。

    4. 这几个主板我也不太确定能不能插得进两块,上面也提到最好看看别人有没有一样的方案。补充:我在 B 站评论看到的一些数据:
    “华擎太极的 pcie 2 在 slot7“
    pcie1 我自己目测再 slot3 ,因此或许有 4 槽可用的。5090 的厚度基本上是 3.5 槽~ 4 槽,好像只有一款是 3 槽的,非常丐,忘记是不是你这款了。
    Quik
        46
    Quik  
       7 天前
    @Saunak
    一槽好像是 2cm ,问客服可以参考一下这个。
    Saunak
        47
    Saunak  
    OP
       7 天前
    @Quik
    现在的情况也了解过。主要是手上只有笔记本,课题组的服务器严重不够了。都没资源开发调试,只够训练了。数据比较多,不太适合租卡。

    1 主板
    华擎:之前没看到烧 u 这个问题,似乎现在谈不上完全解决。而且太极这个主板,我看到有说,双卡启动不了的。后面换了 godlike

    微星:
    X870E Ace 不确定还要等多久上市,价格也不太清晰。
    X670E 暗黑 jd 上我看似乎已经买不到了。好像只能咸鱼了?不知道会不会有烧 u 或其他问题?
    微星目前只有 x870 godlike 满足,但是超预算了

    那么当前能满足需求的似乎只有华硕的 X870E HERO 。但是咬显卡的 PCIE 金手指不清楚实际的损害大么?

    或者 我并不一定当前马上上双卡,那么用 B850 或者其他这类先过渡下,等 X870E Ace 出来后,更换双卡的时候再换主板?

    2 耕升 这个品牌不太了解。我是问京东的客服和我说 3 年质保,换同型的卡,不会换 dv2 ,但是实际会不会变就不知道了
    Quik
        48
    Quik  
       7 天前
    @Saunak #47
    咬金手指其实还行,因为一般也不会来回插拔显卡,不过有例子是金手指被咬然后影响质保的。

    或者可以看看 X670E Ace ,好像也还行,京东还在售。

    另外我还发现, 技嘉有个超级冰雕 X3D ,好像是新出的,评价也不错,也支持拆分。链接是 https://item.jd.com/100278855366.html ,看价格就是次旗舰。
    Saunak
        49
    Saunak  
    OP
       7 天前
    @Quik
    超级冰雕 X3D 好像是还可以。
    但是我发现 5090 似乎厚度都是 64-68mm 以上了,好像都装不下?得用 PCIe5.0 延长线出来?
    Saunak
        50
    Saunak  
    OP
       7 天前
    @Quik

    [朴实无华的 11W 主机:9950X3D 搭配 X870E Godlike 超神主板插满两张 RTX5090 显卡,192G 内存 40T 固态插满!] https://www.bilibili.com/video/BV1FvdVYXE72/?share_source=copy_web&vd_source=6655df57a0cb8e6af359c003e40da23c

    好像不管什么主板,要双卡 5090 ,都至少得一张水冷卡,不然厚度会卡住 PCIe
    Quik
        51
    Quik  
       7 天前
    @Saunak #50 两个 PCIE 插槽距离够多也是能塞得下两张风冷卡的。第一张卡用水冷就可以减少两个 slot 距离的需求,这时候主板的选择就更多。

    当然水冷不好维护也是真的,而且也不好出二手,所以一般富哥会这么选。

    我又确认了一下显卡厚度:
    5090FE 是 2.5 槽厚,是最薄的风冷卡,兼容性也超级好,是可以塞进 ITX 的那种。
    影驰的大将和耕升的踏雪都是 60mm 左右,也就是 3 槽,是除了 FE 之外最薄的,所以兼容性也还可以。
    bwnjnOEI
        52
    bwnjnOEI  
       4 天前 via iPhone
    买新不买旧啊,那个 48g 的我也心动过,但是毕竟改装卡。只要是 moe 架构的模型都可以把专家权重卸载到 cpu 只把前 n 曾放在 gpu flash-atten kv 都不用设 q8 也就是说 60g 以内的模型在权衡质量和 tps 和预算的情况下你都能跑 gpt-oss-120b qwen3-30b ,4090 也能到 20-25tps ,当然还能优化
    Saunak
        53
    Saunak  
    OP
       4 天前
    @bwnjnOEI
    选了 5090D ,现在在考虑有没有什么防烧接口的方法。
    1 可能会加几个风扇对着接口吹。
    2 然后,Afterburner 降频一下,似乎性能就掉个 5%。
    3 我用的长城 2000w 的电源原装线。但是很多说原装线不好,还不如淘宝上几十块定制的电源线?这个不太懂,不知道应不应该换?有没有分享下经验的?

    4 翼王,之前开源了个电流检测的线,但是成品太贵了,我看有的卖 7-800 。海韵的电源好像后面也说会上类似技术,但是价格估计也不便宜。
    https://www.bilibili.com/video/BV12WJLzDEua/?spm_id_from=333.337.search-card.all.click&vd_source=4c3baef3066009f2077ae88c037de0c3
    bwnjnOEI
        54
    bwnjnOEI  
       2 天前 via iPhone
    @Saunak 电源黑匣子吗? 1600w 够了吧,尽可能买贵的,用显卡带的线安装时最好拍个视频(虽然也没啥用 要是不放心再上个稳压器或者 ups 之类的(其实没啥大用 显卡待机也就 2 3 十瓦 你跑模型多说飙到 100w (我说的是推理,我微调或者 rl 都用实验室的卡或者买 gpu 云
    bwnjnOEI
        55
    bwnjnOEI  
       2 天前 via iPhone
    @Saunak 现在官方店都是 5090d v2 吧,官方店好像只有超级雕有 d
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2519 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 09:50 · PVG 17:50 · LAX 01:50 · JFK 04:50
    ♥ Do have faith in what you're doing.