实验室有卡,但是要排队,很多开发和测试不方便(租卡迁数据更不方便)。计划配一台家用的 AI 开发机,主要是跑 7B-32B 的 LLM 。因为住在租的房子里,所以对噪音和散热比较敏感。目前预算先上一张卡,未来可能升级双卡。现在对 GPU 的选择非常纠结,想听听大家的意见。
选项 A:魔改版 RTX 4090 48GB
优点: 显存巨大 (48GB) 多卡兼容性:wsl2 下似乎可以多卡?只需要消费级主板? 顾虑: 散热/噪音:涡扇版据说噪音巨大,不适合家用。可能要三风扇或水冷版。水冷长期可靠性(漏液风险)没底。 质保风险:没有官方质保,完全依赖店铺。看到有人炸缸,店铺进行了更换,但需要提供温度记录之类。
选项 B:RTX 5090 32GB
优点: 性能更强:下一代架构,核心性能肯定提升巨大。 家用友好:散热和噪音控制肯定比魔改方案好,适合家庭环境。 顾虑: 显存稍小 (32GB) 兼容性:看到有说法是“老模型可能用不了” 多卡兼容性:wsl2 下好像完全无法兼容多卡。且需要服务器级主板
我想问的问题:
想问的问题:
感谢各位的宝贵时间和建议!
1
Ritter 23 天前
要我选肯定 5090
|
2
bigtear 23 天前
看你的需求,感觉懒猫 AI 算力舱挺适合你的,我日常跑 qwen 和 comfyui 还可以,如果感兴趣可以搜一下,他们客服挺活跃。
|
3
bigtear 23 天前
如果不是刚需,建议等,因为接下来肯定各家都要上大显存的设备
|
4
shenqi 23 天前
如果一定选,建议 5090 ,后续升级显卡卖出去更值钱。这个是从经济角度的。
|
5
HenryHe613 23 天前
32B 可以用 5090 32G 跑,所以 48G 和 32G 对你来说差别不是很大。
目前没有遇到老模型用不了的问题,只是 PyTorch 需要用 nightly 渠道安装,不然会不支持 5090 的驱动。 5090 非国行也没有保修,我是去日本旅游顺路带了一张回来自己用。但是相比 4090 改装版,我觉得原厂的质量更加可以信赖。 如果后期需要上双卡,记得电源预留点空间,这样后期升级可能会节省一笔费用。1000W 以上的电源可不便宜。 |
6
sunny352787 23 天前
不考虑 A6000 ada 这类专业图形卡吗?相当于官方的 4090 48G ,5090 的价格都能接受了那 A6000 也没差太多了
|
7
Saunak OP @sunny352787 A6000 和 A6000 ada 是两种哇。服务器用的就是 A6000 ada ,那个太贵了,一张要 5w 多
|
8
robbaa 23 天前
双 3090+nvlink 先用着,后期再说后期的问题,到时候说不定 6090 都出来了
|
9
sunny352787 23 天前
@Saunak 我知道是两种,不过现在 5090 满血版能买到吗?要是不好买的话魔改版 4090 还是不太放心,所以我想不如考虑 A6000 ada ,但确实有点贵哈哈哈哈
|
10
jiujiutang 23 天前
这篇文章的思路也可以参考下。https://mp.weixin.qq.com/s/vIrvbVJ6Nv00Ehre1zZwMw
|
11
Quik 23 天前
就从我自己了解的部分来回答部分问题以及一些建议:
1. 除非你租房有专门放机箱的房间,否则没办法用涡轮卡; 2. 关于显卡需求的 PCIE 通道:5090 理想情况下是需要 PCIE 5.0 * 16 的,但是 PCIE 5.0 *8 也有人说损失很小。4090 需要 PCIE 4.0*16 就行,也就是 PCIE 5.0*8 的速度,不过不知道 PCIE 4.0 * 8 有多少损失。 3. 主板选择:首先确认是 msdt 还是 hedt 。 - 家用主板对多卡的支持性很差,但也有少部分选择(虽然性价比不高)。这种情况下需要找专门能支持显卡 PCIE 拆分的主板,将 1 个 PCIE 5.0 * 16 拆分成两个 PCIE 5.0 * 8 。用 AMDcpu 的话,微星的 800 系主板只能看一下 X870E Godlike ,或者再等等后面出的 X870E Ace 。600 系主板便宜的选择是 X670E 暗黑,除了内存支持略弱其实扩展性更好一点,这块板子可以看做最便宜的支持双 PCIE5.0*8 的主板,但是给显卡的第一个 PCIE 插槽在第 3 槽,导致物理空间拥挤。或者看看 Intel 的主板也行,虽然 CPU 稀烂并不推荐。 - 服务器的话我想到的是 7K62 这种洋垃圾,看起来也还行,主板也不算贵,至少 PCIE 通道很多(基本上都是 PCIE*4.0 *16 ,所以不需要担心通道不够,相对应的也没有物理空间问题。 4. 关于显卡的物理空间:5090 风冷基本上都是 3 槽及以上的,两张超厚风冷卡并排其实散热不太好,吃尾气。关于物理空间不够用(例如两个拆分后的显卡 PCIE 插槽只有 3 槽),可以用 PCIE 延长线的。 5. 考虑双卡基本上都得上超大机箱了,例如追风者 PK620 这种的。当然机架式的也不是不行。 |
12
KimGuo 23 天前
最近听说有个方案,是把两块 v100 16GB 通过转换器转成一个 PCIE (两个 x8 )然后通过软排线接到主机上的方案
好处是便宜(咸鱼成品大概是 2800 ) 坏处是需要主板支持通道分割、v100 不支持 fp16 运算(不兼容一些新的推理模型)、个头不小 |
13
Saunak OP 电源和机箱这个问题倒是不大。
主要是主板和系统不太了解。我看很多测评说 5090 需要双 PCIE5.0 x 16 ,一般的消费级主板带宽不够会导致双卡速度非常低。https://zhuanlan.zhihu.com/p/1906986288147563035 看到可行的方案有 GIGABYTE TRX50 AI TOP + AMD 线程撕裂者 7960X ,不晓得有稍微便宜点的没。 []( https://www.xiaohongshu.com/explore/67f3f894000000000f03be93?xsec_token=ABrHcV3PAqG0pzB8e4RojCRGvBJJYysnPQtFynCnUYn0Y=&xsec_source=) |
14
Saunak OP @sunny352787 5090 和 5090 D 测试好像差别不大吧?只要不是 24G 的版的。
我看其他平台很多推荐 4090 48G 的,不知道是卡贩还是啥。这个帖子倒是清一色的推荐 5090 |
15
Saunak OP @Quik 谢谢这么详细的分享。
看到可行的方案有 GIGABYTE TRX50 AI TOP + AMD 线程撕裂者 7960X 。 https://www.xiaohongshu.com/explore/67f3f894000000000f03be93?xsec_token=ABrHcV3PAqG0pzB8e4RojCRGvBJJYysnPQtFynCnUYn0Y=&xsec_source= 我想问下如果用 5090 双卡的方案(非水冷),我后期自己加卡。那么现在的主机是找 jd ,tb 的供应商定制,还是自己 diy ,或者买了找 jd 装机的人装比较好? jd 和 tb 的供应商,我看似乎配置都不太灵活,而且价格会高不少,不晓得他们的售后有没有用 |
16
Quik 23 天前
@Saunak #15 我的看法:
1. 个人买 5090 约等于没有售后(包括但不限于店保、白牌等),供应商之类的也不好说,这方面就是买别怂,怂别买。不过显卡这种东西是不拿来折腾的,我拿到手之后测了一天的甜甜圈什么的,温度也不是很高,切到 Ubuntu 之后赶紧加上了 450W 的功耗限制。就算是真坏了也有 B 站张哥和靓女能修。最常见的坏法就是少接口,搬板也就 2-3k ,其实成本没有想象的高(只要核心没坏)。 2. 供应商的售后,个人买还真不了解。但是同学之前了解过官方采购那种途径(就是 30W 以下的单位采购,无须招标,可开票),当时听说是坏了包修 or 换,供应商说是有到 SG 的途径去修卡或者售后卡。缺点是性价比低,你需要用旗舰卡的价格买丐卡。 3. 实在担心售后,考虑一下 5090D ?好像 5090D 相对于 5090 就阉割了 FP4 ,对 99%的场景都是暂时用不到。一般自己 fine-tune 都至少是 fp16 或者 bf16 吧。不过也有人说 5090D 的核心已经停产,即便是核心出问题售后也是有去无回,而且一些显卡品牌的售后还不怎么样(比如微星),或者你 5090D 拿去售后给你换成 5090Dv2 ,什么说法都有。至少现在有小问题还是都能给解决的。 我个人是就用了 1 张 5090 (微星的神龙)。温度也不会多高,个人感觉 3 年很难用坏。 ![]() |
18
sunmacarenas 23 天前
可以看下 rtx5880ada ,价格与 5090 差不多,显存是 48G
|
19
coefu 23 天前
你不给预算怎么推荐?如果只是跑 LLM ,不做别的,那我推荐 Mac studio M3 pro 。 你会发现,仅仅是放在住处,这是多么睿智的选择。如果你有类似于 IDC 的环境,自己组装台式机+GPU 是个好选择。
|
23
cpstar 23 天前
不是有一个 GB10 的各家小主机
|
24
coefu 23 天前
@Saunak #22 GPU 主要是保值,但是关键问题,你要放住处,那就难搞,但凡组的 GPU 台式机,第一,功耗高,第二热量和噪声大,这个是会影响到生活的。mac studio ultra 的情况是,如果你统一内存买小了,后续不怎么保值,你要是再出手估计要打折。对于你的问题来说,我觉得 mac studio ultra 是最优解。
|
25
coefu 23 天前
@Saunak #22 4090/5090 单卡功率 595w ,2 张就要 1200w ,带上主板 CPU ,电源按照转换率 80%起码要买 2500w ,跑满的时候,一个小时 2.5 度电,你遭的住?不要小看这个啊,电表倒转。
|
26
coefu 23 天前
@coefu #25 mac studio m3 ultra 最大持续功率:480 瓦,工作温度:10°C 至 35°C (50°F 至 95°F)。对于放到住处,过来人的经验。
![]() |
27
FakerLeung 23 天前
多 I 卡试试?
|
28
mayday1997 23 天前
@bigtear 这个平台有 nfsw 审查吗
|
29
mayday1997 23 天前
@bigtear 抱歉,查了下不是平台,打扰了
|
30
bigtear 23 天前
@mayday1997 #28 整机,和 Mac Studio 差不多
|
31
propheteee 22 天前 via Android
英伟达新出的针对个人开发者的 DGX Spark 考虑下不,128g 共享内存
|
32
Saunak OP 我是用来开发和调试的,需要进行一定的训练,但是不会完全在自己的机器上跑。mac studio ultra 好像主要是推理吧?
双卡主要是预留,后面如果有需求扩展 gpu 就不浪费之前的机器了。双卡不一定是刚需。 如果不拓展我就当做高性能主机用了。 租房有单独的卧室,只是办公和机器要在一起。 |
33
8355 22 天前
现在普通成色的 4090 卖给一般消费者,好成色的都在机房出租
肯定是买新不买旧 |
35
HenryHe613 22 天前
|
36
Quik 22 天前
@HenryHe613 #35 自己限制的,怕 600W 烧接口。主要是 Linux 下没有 Afterburner 这种工具能够调整电压/频率曲线,只能限制一下总功耗规避一下风险。限制功耗性能比 4090 还略微强一点。
|
38
Quik 22 天前
@mystical #37 现在没有全新的 4090 了吧,要么是二手,要么是 4090 48G 。前者大概一万七,后者两万+,跟 5090 差不多的价格。4090 早就不是以前一万二左右价格的时候了
![]() |
40
Quik 22 天前
@Saunak #39 一般都是二手改的,所以我有些信不过。
5090 和 5090D 少接口差不多,本质上是功率高+这个接口设计垃圾没有均流导致的,没有太多好的办法。不过烧接口毕竟是少数,应该问题不大。 防止的话: 1. 保证接口插紧,windows 下可以通过跑甜甜圈+监控一下 12v 的电压(具体忘了,B 站有教程)。 2. 另外这个接口的插拔次数的寿命很少,不要过多的插拔,次数多了就该换线。 3. 线缆尽量不要弯折,尤其是靠近机箱侧板的部分,有条件的话可以先用 90 度接口的线(部分电源厂商会提供售卖,例如首席玩家)。 4. 微星的 5090**绝对不要用**显卡自带的那根双色线,烧过好多了。尽量用电源附带的线。https://www.bilibili.com/video/BV1C8x1zSE2Z/ |
41
BingoW 19 天前
我也不太懂,你说的处理 32B 是微调吗,我家 2080TI 22G 魔改版本 也能跑 千问 32B 大模型 速度是 20 多 token/s 微调的话,我理解你这两款显卡都可以,看性价比,以及后续升级多卡匹配性。如果上来就考虑多卡方案,机箱先选个支持的吧,我想玩双卡魔改 2080 ,但是我机箱就一个显卡位。
|
42
Saunak OP @BingoW 4090 多卡倒是没什么问题,就是卡本身可能是旧卡,质量风险大。5090 的多卡比较复杂,不知道能不能行。
后期如果再考虑双卡可能有点浪费前期买的主板和电源。这么考虑也是情况有点特殊,算是转行在弄这个,不确定后面有没有公家的卡可以用,所以要自己做项目的话,还是双卡可能方便点 |
44
Saunak OP @Quik
大佬,我研究了一下,最后还想请教下。 感觉核心需求是支持双显卡槽直通拆分 PCIE 5.0 * 16 拆分成两个 PCIE 5.0 * 8 最好能支持 DDR5 * 4 在满足上述核心性能需求的情况下,可以考虑价格低的: 1 CPU 和 主板 选哪个呢? 2 电源是 1600W 还是 2200W 呢? 3 耕升 GeForce RTX 5090 D 炫光 OC 32G 京东的行么?(客服说可以保修) 4 这个主板应该能插的进双卡 5090 吧? 主板 华擎 X870E TaiChi/X870E HERO/PROART X870E 电源 长城黑匣子 2200W CPU AMD 9950X3D/9950X/9900X3D 散热器 瓦尔基里 B360 一体式水冷 内存 96GB(48GB*2) 机箱 追风者 PK620 工作站版 显卡 耕升 GeForce RTX 5090 D 炫光 OC 32G @Quik |
45
Quik 7 天前
@Saunak #44 并非大佬,哈哈~
其实现在并不是一个特别好的时间来 DIY 电脑。一方面最近内存大涨价,另一方面 AMD 明年的 zen6 新 U 好像性价比更高(现在 9950X 只是 16C32T ,明年新 U 据传是 24C48T ,而且配套的新系列主板)。 如果非要现在买的话: 1. CPU 和主板的购买个人建议: 关于 CPU:你需要评估一下 X3D 对你有没有用,我个人觉得 AI 是不需要 X3D 的,所以考虑成本 9950X 足矣。 关于主板: - 华擎的太极是最便宜的 X870E 旗舰板,但前段时间华擎有烧 U 的新闻( CPU 底座烧毁),而且 BIOS 更新较慢,约等于没有售后(毕竟是越南擎); - X870E HERO 是华硕的,这代华硕的主板说是会咬显卡的 PCIE 金手指,换新版之后据说效果也不太行; PROART 不知道是不是也一样,不介意这一点华硕的板子没什么问题。 - 也可以关注一下微星的 X870E (不知道 Ace 出了没有),之前微星允许双 X8 的只有 Godlike ,似乎新的 X870E Ace 也会支持这个特性。推荐微星的原因是微星这代对内存的支持特别好,插满 4 条很简单就能启动,符合你对“支持 DDR5 * 4“的需求。(我自己的是 X670E 暗黑,更新 bios 之后,用的内存条是 64 *4 ,设置好 EXPO 一次性启动成功,就是自检略长,800 系主板原则上兼容性比 600 系还要好)。 以上主板不只是要看能否支持 PCIE * 8 拆分,还要看两个支持拆分的 PCIE 插槽的槽位距离。我没有具体的插槽距离数据,看别人的视频( https://www.bilibili.com/video/BV1YSe7zkEDu/)感觉太极和 Hero 的间距是够的,如果不放心最好问问客服或者找找其他确定来源(例如看看别人的装机视频,对比机箱屁股或许可以看到相聚几个槽位)安全的话最好有 4 槽。 2. 关于电源,既然你都问了,那我肯定推荐 2200W ,冗余多一些(只是从功率角度推荐,没有细看电源的做工)。1600 感觉凑活够(很多人单个 5090 就用的 1000w ,再加额外一个 5090 的功耗刚好是 1600w )。 3. 跑 AI 的话,5090D 是完全没问题的。现在怕的是 AIC 各种吃相难看,如果核心坏了,你找官方售后会告诉你没有备件(因为 5090D 的核心已经停产了),然后**可能**给你换成 5090Dv2 (显存变成 24G )。当然这个只是大家的推测,毕竟也没有见到实例。如果只是其他的小部件坏了官方修好肯定是没啥问题的。所以从这个角度看也算是可以买?不过你从京东买最好是自营,不然和第三方店铺以及淘宝没有任何区别。 4. 这几个主板我也不太确定能不能插得进两块,上面也提到最好看看别人有没有一样的方案。补充:我在 B 站评论看到的一些数据: “华擎太极的 pcie 2 在 slot7“ pcie1 我自己目测再 slot3 ,因此或许有 4 槽可用的。5090 的厚度基本上是 3.5 槽~ 4 槽,好像只有一款是 3 槽的,非常丐,忘记是不是你这款了。 |
47
Saunak OP @Quik
现在的情况也了解过。主要是手上只有笔记本,课题组的服务器严重不够了。都没资源开发调试,只够训练了。数据比较多,不太适合租卡。 1 主板 华擎:之前没看到烧 u 这个问题,似乎现在谈不上完全解决。而且太极这个主板,我看到有说,双卡启动不了的。后面换了 godlike 微星: X870E Ace 不确定还要等多久上市,价格也不太清晰。 X670E 暗黑 jd 上我看似乎已经买不到了。好像只能咸鱼了?不知道会不会有烧 u 或其他问题? 微星目前只有 x870 godlike 满足,但是超预算了 那么当前能满足需求的似乎只有华硕的 X870E HERO 。但是咬显卡的 PCIE 金手指不清楚实际的损害大么? 或者 我并不一定当前马上上双卡,那么用 B850 或者其他这类先过渡下,等 X870E Ace 出来后,更换双卡的时候再换主板? 2 耕升 这个品牌不太了解。我是问京东的客服和我说 3 年质保,换同型的卡,不会换 dv2 ,但是实际会不会变就不知道了 |
48
Quik 7 天前
@Saunak #47
咬金手指其实还行,因为一般也不会来回插拔显卡,不过有例子是金手指被咬然后影响质保的。 或者可以看看 X670E Ace ,好像也还行,京东还在售。 另外我还发现, 技嘉有个超级冰雕 X3D ,好像是新出的,评价也不错,也支持拆分。链接是 https://item.jd.com/100278855366.html ,看价格就是次旗舰。 |
50
Saunak OP @Quik
[朴实无华的 11W 主机:9950X3D 搭配 X870E Godlike 超神主板插满两张 RTX5090 显卡,192G 内存 40T 固态插满!] https://www.bilibili.com/video/BV1FvdVYXE72/?share_source=copy_web&vd_source=6655df57a0cb8e6af359c003e40da23c 好像不管什么主板,要双卡 5090 ,都至少得一张水冷卡,不然厚度会卡住 PCIe |
51
Quik 7 天前
@Saunak #50 两个 PCIE 插槽距离够多也是能塞得下两张风冷卡的。第一张卡用水冷就可以减少两个 slot 距离的需求,这时候主板的选择就更多。
当然水冷不好维护也是真的,而且也不好出二手,所以一般富哥会这么选。 我又确认了一下显卡厚度: 5090FE 是 2.5 槽厚,是最薄的风冷卡,兼容性也超级好,是可以塞进 ITX 的那种。 影驰的大将和耕升的踏雪都是 60mm 左右,也就是 3 槽,是除了 FE 之外最薄的,所以兼容性也还可以。 |
52
bwnjnOEI 4 天前 via iPhone
买新不买旧啊,那个 48g 的我也心动过,但是毕竟改装卡。只要是 moe 架构的模型都可以把专家权重卸载到 cpu 只把前 n 曾放在 gpu flash-atten kv 都不用设 q8 也就是说 60g 以内的模型在权衡质量和 tps 和预算的情况下你都能跑 gpt-oss-120b qwen3-30b ,4090 也能到 20-25tps ,当然还能优化
|
53
Saunak OP @bwnjnOEI
选了 5090D ,现在在考虑有没有什么防烧接口的方法。 1 可能会加几个风扇对着接口吹。 2 然后,Afterburner 降频一下,似乎性能就掉个 5%。 3 我用的长城 2000w 的电源原装线。但是很多说原装线不好,还不如淘宝上几十块定制的电源线?这个不太懂,不知道应不应该换?有没有分享下经验的? 4 翼王,之前开源了个电流检测的线,但是成品太贵了,我看有的卖 7-800 。海韵的电源好像后面也说会上类似技术,但是价格估计也不便宜。 https://www.bilibili.com/video/BV12WJLzDEua/?spm_id_from=333.337.search-card.all.click&vd_source=4c3baef3066009f2077ae88c037de0c3 |