LeeReamond
V2EX  ›  问与答

未来大模型硬件成本下降 5-10 倍,我们的未来会是什么样的?

  •  1
     
  •   LeeReamond · 18h 20m ago · 1767 views

    说实话最近工作没有太多需求,空下一些时间深夜做一些无所谓的瞎想

    众所周知的是,2023 年 gpt3 刚出来的时候大家可不像今天这么感觉大模型能完美替代几乎所有程序员工作。而 2023 年到现在也不过 3 年。那么,如果再把时间维度拉长到 3-5 年,我们的未来会是什么形态?

    已知前提

    1. 模型的提升本质上实际上是信息密度提升,存在边际效应,但是从 2026 回看过去三年,已经提升很多,未来仍有一定提升空间。
    2. nvdia 的硬件是存在高溢价的,仅从成熟制程集成电路技术的角度来说计算成本没有现在这么贵。

    与大模型聊天后做出的推断性判断

    1. 已知过去三年间低端模型(个人用户的消费级硬件有潜在希望能运行的模型,例如 64B 及以下模型)的部署成本大概降低了 1000 倍。
    2. 高端模型( 1-1.5T 参数)所依赖的部署设备的成本,如果能够去掉类似 cuda 护城河和 nv 溢价的话,未来也不会下降太多,但是下降 5 倍是可能的(也就是说类似于企业部署满血 deepseek v4 pro ,目前的成本比如是 300 万一台机器的话,未来理想情况下可能降低至 60 万,应该不会再低了)
    3. 目前看来可能的提升模型能力的方向,例如多 agent 任务流,消耗 token 数量大概是普通对话的 10 倍左右。
    4. 以当下的重度 LLM 用户的使用习惯来看(考虑人机交互中人类心智端的极限),取决于任务的不同,每天生成 token 数大概在 1M-100M 之间。

    那么综合推断下来 3-5 年后的未来会存在这样一批人

    1. 每天使用大模型综合 token 输出数量在 10M-1000M 之间。
    2. 使用多 agent 执行各种复杂任务
    3. 使用次旗舰级别开源模型,能力超过或与当下的旗舰模型持平(假设与 Fable5 持平)
    4. 每 1Mtoken 的输出成本,按现在的购买力计算,约与当下的 deepseek 官方 api 价格持平( 3-6 元每 M )
    5. 也就是未来会存在一些每天花费大约一百-几百到 1-2 千元 token 成本,生产效率约等于无限制使用现在的 claude Fable5 模型进行各类工作(很可能是多模态工作)的这么一些人。

    所以未来编程行业会是什么样呢?未来各行各业会是什么样呢?大厂工作的人我感觉未来 5 年应该都能做到上述推断的程度,大厂的生产力会前所未有的蓬勃,个人工作者市场应该会完全消失。其他所有从事文创、生产类工作的工作者,比如在起点写小说的,可能会有 fable5 帮忙连续不断地 24 小时推演。

    24 replies    2026-06-16 17:37:28 +08:00
    LeeReamond
        1
    LeeReamond  
    OP
       18h 14m ago
    大概四五年前,程序员开发副业还有通过类似个人编程能力,实现潜在财富自由的指望(比如开发一款好用的 app )。当年站内比较火的有类似于记账软件产品被大厂抄袭之类的事发生。那么随着现在大厂生产力越来越蓬勃,以后这些中小软件 app 开发致富的路子应该完全不会有市场?中小厂商都要倒闭?
    trn4
        2
    trn4  
       18h 10m ago   ❤️ 2
    你这话仿佛是在上个世纪内存还是 640KB 的时候问:”未来内存涨到 8MB 了会是什么样子?“。安迪比尔定律告诉你了,硬件再强都会有更强的模型把他耗尽。你的硬件永远不够。
    trn4
        3
    trn4  
       18h 8m ago
    @trn4 #2 简单来说就是 AI 工作流消耗越来越高,高端模型依旧高质高价拿走大部分利润,低端进入价格战普及模式。计算机发展史已经走过一次了。
    LeeReamond
        4
    LeeReamond  
    OP
       18h 0m ago
    @trn4 我是站在历史潮流里一个渺小的人,如果我生活在 1990 ,我想知道人均内存 1G 的时代是什么样子,4G 的时代是什么样子,64G 的时代是什么样子。高端模型的高质高价我倒感觉边际效应越来越明显了,模型不断地变聪明,但是又能聪明到哪里去呢?硬件成本下降和服务竞争红海化我倒感觉你说的低端价格战普及会带来的影响更大一些
    xlxx
        5
    xlxx  
       17h 16m ago
    🎅有可能能把软件外包价格打下来?
    tywtyw2002
        6
    tywtyw2002  
       17h 10m ago via iPhone
    @LeeReamond 有些基础理论,你可以问问 AI 去了解下。

    对于内存 cpu 的例子,针对大型企业用户的例子是成本指数级下降。
    以前大型运算要 openmp ,并且不便宜。2012 年左右成本就已经可控了,不需要搞一机房服务器就能算了,一机柜足以。然后 2018 年,一台服务器对于很多计算都足够了。然后就没人搞服务器了,直接 aws 算了。

    ai 基础算法 1990 年代就以及有了。剩下的就是算力。
    LeeReamond
        7
    LeeReamond  
    OP
       16h 25m ago
    @tywtyw2002 我觉得倒不用说 bp 在多少年前就有了这种废话。至于企业级内存 cpu 成本下降的例子,你看 cuda 都是一个多少年的产品了,到现在科学计算还是这套东西,它的成本下降会继续走以前的路子吗? 6 年时间里从一个机房缩减到一台单机?我不看好。
    trn4
        8
    trn4  
       15h 59m ago
    @LeeReamond #4 “但是又能聪明到哪里去呢?”你在问一个目前还没有答案的问题,而你已经有了你自己的答案并且基于你的答案开始推演了。
    msg7086
        9
    msg7086  
       15h 18m ago
    > 但是又能聪明到哪里去呢
    之前大家也是这么说的。

    现在的模型还有非常大的提升空间。比如超长上下文注意力不集中的问题,给个 250k 的上下文 AI 就不知道自己前面在想什么了。还有思考能力的问题,现在模型可以做中高级难度的开发,但是再往上,比如到复杂的系统设计,就开始不行了。这些如果能再改善一些,就又能大幅提升一把智力。

    至于将来会变成怎么样,说实话谁都说不准,问了也无非就是大家拍脑袋想想而已。
    LeeReamond
        10
    LeeReamond  
    OP
       15h 13m ago
    @trn4
    @msg7086
    我觉得这个问题是这样,模型智力的问题现在边界是能看见的,不是很久之前就有人说全网的语料都被训练完了。所以未来的提升我感觉应该是智力上限提升很困难,但是从信息密度的角度不断的凝练是很有可能的,可能将来 300B-1T 之间的中型模型的智力还会有显著进步。

    所以不妨基于这个前提可以推演一下当广谱智力真的普及之后社会形态会变成什么样,我觉得拍脑袋想想也没啥不好的么,1920 年还有科幻小说呢,其中不乏也有预测未来预测的很准的
    ntdll
        11
    ntdll  
       15h 13m ago
    >> 那么随着现在大厂生产力越来越蓬勃,以后这些中小软件 app 开发致富的路子应该完全不会有市场?中小厂商都要倒闭

    如果这个说法成立,那么至少在 20 年前就已经被大厂垄断了。

    技术人员不要把自己看的太重要,一款产品,不论是传统行业还是信息技术行业,专业技术人员在其中的重要程度是最低的,也就是最不重要的,除了一些高精尖的领域。

    非高精尖领域的技术人员的所有问题,花钱都可以解决,不存在真正的专业壁垒。

    而市场推广和营销是花钱也解决不了的,时代的机遇(或者说运气)同样也是花钱也解决不了的。

    当年还不是大厂的小米,做出来的米聊,为什么只有腾讯抄了,而且还成功了,同为大厂的阿里真的是因为技术原因做不出来嘛。

    当年如日中天的诺基亚,是如何都还没看清对手,就被 iPhone 埋入了土里。

    彼时小作坊米哈游,凭借 50 万启动资金,做出了崩坏学园,更成为了现在二游市场的一座高峰。

    ---

    技术很重要,但是没那么重要,相比而言,能把产品推广出去远比技术更重要(更难),这里面也需要不少运气的成分。
    LeeReamond
        12
    LeeReamond  
    OP
       15h 2m ago
    @ntdll 你说的这个肯定是对的,但是我觉得现在的一个改变是,大厂肯定还是有大厂的毛病,以前不是技术不到位,很多时候是非技术问题。但假定给你一个无限蓬勃的生产力预期的话,比如以前我们出现一个爆款 app ,大厂要复刻可能要拉一个组出来,以后它可以搞一个组专门复刻市面上的各种 app 然后加到自己家的小程序平台里,现在也不是需求很蓬勃的时代了,一个组能把全网能做的全做了。然后另一个组专门搞推广,推广能力也比以前强。从个人开发者的角度跟这种体量的东西竞争实在是想不出什么能赢的点。
    msg7086
        13
    msg7086  
       14h 30m ago
    @LeeReamond #10
    当然有预测未来预测得很准的,但这意义不大。学过信息论就知道,这样的讨论就等于没有信息量。
    比如你预测,明天可能下雨,但也可能不下。晚上可能吃面,也可能不吃面。
    你说未来 50 年内核聚变可能可以投产使用,但也可能无法投产使用。这是不是预测了个寂寞。

    咱不说那么复杂的东西,就像你说的 GPT3.5 出来的时候谁会想到现在大模型+Agent 可以直接上手半自动化开发复杂的软件。当时的你可能连 Agent 这样一个东西将会被发明出来都不知道。没有多少人类可以凭空想象出还不存在的东西,如果你可以,那你应该开始创业。

    很久以前在油管上看过一个视频,里面就提到了未来人类会遇到的情况。你进入大学学习,然后大一大二学到的前沿知识,到了大学毕业的时候就已经过时了。你高中时候对未来做了职业规划,想着将来我要在某某行业做某种工作,结果到了找工作的时候发现,这个工种已经消失了。而取而代之的工作岗位,可能是三五年前根本还不存在的工作,工作内容要处理的,甚至是人们可能从来没想过的问题。整个世界都在以指数级的速度发展,过去 5 年内创作出的新知识可能比过去 5000 年的还要多。

    当然我不是说不能去预测未来,只是未来的变化实在太快了,在新的变化出来之前你可能根本就没想到这会是个变化,历史的滚滚洪流就把你当减速带碾过去了。

    顺便一提,就算能去掉 CUDA 护城河,你用 AMD 的显卡也不会便宜。如果 N 卡和 A 卡都降价了,Cerebras 也不会便宜。Cerebras 如果便宜了,那人类就可以迈出一大步了。

    现在大模型的弱点,除了上面说的注意力和智力,还有速度。现在普通人用的 AI 无非也就是几十 tps ,你要用美国豆包 3.5 Flash ,那说不定能跑个小几百 tps ,要实时响应还是太慢了。如果能保持现在 5.5 xHigh 的智力水平然后再把速度提升 20 倍,那开发的体验会好很多。当然价格如果能打下来那就更好了。现在写个大项目一个月得花好几千,要不是公司买单,我自己掏钱做开源软件那是真用不起。
    ntdll
        14
    ntdll  
       14h 26m ago
    @LeeReamond #12 ,以这种视角来看待,各行各业,都有自己的“大厂”,这同样和 IT 行业无关,也和 AI 无关。那各行各业的小作坊就应该都不存在了。

    如果现在国内的腾讯、阿里,海外的微软、Google ,只要他们愿意,并不需要 AI ,他也可以把全网所有个人开发者能做的都做了,也可以推广,他们并不差钱,也并不差人。但事实并没有这样。

    我不知道你是如何认为大厂们为什么不这样做的。我肤浅的认为就是“不想”,因此在后 AI 时代,大厂们也依旧“不想”,这无关于成本。

    大厂们的抄,更多的也是其原有产品线与你说的个人开发者重合了,才抄的,而不是无条件的抄。而这种基于产品线的抄,有没有 AI ,大厂们都会抄,大不了收购嘛,个人开发者本身就没几个钱,对大厂来说其实没区别。有没有 AI 并不影响大厂们的决策。

    ---

    况且我认为恰恰相反,AI 在肉眼可见的阶段里,仍然是提高下限,但难以提高上限的。

    没有编程基础的人,可以编写一些简单的小应用、小程序。
    没有视频剪辑、拍摄基础的人,可以生成一些小短片。

    但是对于提上限的工作,AI 是难以有所帮助的,比如把全行业的顶尖资料都喂给 AI ,他有机会设计出芯片嘛。

    换而言之,就是让一些原本难以进入某些具有一定专业壁垒的领域人,现在可以在这些领域内有一些创作/表达,而原本就具有相关能力人,其创作效率得到了提高。

    我认为是有利于中小,乃至个人开发/创作者。对于大厂来说,预算 1 万、10 万、50 万、100 万甚至 1000 万来尝试某个领域,其实完全没有任何区别,但是对于中小企业和个人,是存在巨大区别的。

    某个创意的实施,如果需要 100 万,你可能就不干了,10 万的话,也许咬咬牙,你想要尝试一下,1 万的话,可能大概率就会试试了,博一个机会。
    msg7086
        15
    msg7086  
       14h 5m ago
    @ntdll
    > 但是对于提上限的工作,AI 是难以有所帮助的,比如把全行业的顶尖资料都喂给 AI ,他有机会设计出芯片嘛。
    难说。

    假如我们可以假设,AI 的能力上限与人类相同(毕竟 AI 就是在用硬件去模拟真实的人类智力),那么人类能做到的 AI 没有理由做不到。设计芯片这种相对「简单」的工作对 AI 来说只会更简单。大部分同类工作对人类来说都是属于智力能及但时间精力不可及。比如编程,只要给你足够的时间去分析系统结构,调试运行状态,一个普通人也足够可以从零写出 Linux 内核,只不过这个人写到现在这个规模可能要花上几千年时间。我们现在谈及的大部分普通编程工作都是属于这类。芯片设计也一样,写个简单的电路不成问题,提升性能提升规模反复迭代才是花时间的地方。要是 AI 能以人类 100 倍的速度自己去迭代呢。

    我倒是觉得现在芯片行业最难的还是在那些物理化学之类的工艺问题上。光刻胶,EUV ,如何制造出这些硬件设备,如何对抗这个宇宙的基本法则,这些才是 AI 搞不定的部分。
    GPLer
        16
    GPLer  
       11h 17m ago via Android
    为什么一定是下降,而不是上升呢?生产力工具不可能一直低价,不妨以硬件成本上涨 5~10 倍再做预测。
    lululau
        17
    lululau  
       10h 26m ago   ❤️ 1
    下降 5-10 倍是什么虎狼之词,下降 1 倍不就已经是 0 了吗,5-10 倍是什么鬼
    fredweili
        18
    fredweili  
       10h 24m ago   ❤️ 1
    大学要重构,这么多家庭花了这么多金钱时间,孩子这么辛苦,上个大学能会的东西,还不如简简单单的大模型,对社会没什么价值
    xixiv5
        19
    xixiv5  
       10h 20m ago
    先把内存条价格降下来再说
    miniliuke
        20
    miniliuke  
       10h 17m ago
    摩尔定律已经失效了,只能在硬件架构上面努力了
    tsja
        21
    tsja  
       9h 26m ago
    我也想过和楼主一样的问题,gpt4 出来的时候,觉得如果这样的模型能免费就能大幅提升我的开发效率;但是现在随便一个开源的量化模型都能比 gpt4 强千倍;几乎白菜价的 DeepSeek V4 也能达到御三家的七八成水平;但是我还是再给 ChatGPT Claude 付费。再结合前面几楼也评价了,CPU 性能、内存闪存的性能容量提升,总是会被新技术新需求填满。我完全不敢说国产的几家模型就够普通人使用了,也许总有一天开源的 Qwen 6 已经达到了 Fable5 的水平,但是国外御三家又是一个新的高度,DeepSeek 的低价也卷到另一个深度,一切的代价都是对硬件的极致需求。现在老黄的硬件已经不是基于性能和规模定价,而是基于能跑什么样的模型定价,大概率未来也一样
    paopjian
        22
    paopjian  
       8h 40m ago
    手机便宜了 bb 机就被淘汰了, 以前电话秘书都是新奇玩意, 现在 siri 小爱都是小傻瓜了, 等大模型解决了性能 记忆 幻觉问题, 就能取代很多岗位和 app 了, 你以后也不会需要记账 app 这种玩意, 因为内置 ai 都能帮你自动记账了. 你也不会有自己写代码造 app 的想法, 因为 AI 甚至能直出 HTML 给你做 demo, 人人都能复制页面. 仅仅是 seed2.0 这种 aigc 能力, 都能简单实现一些超高预算才能实现的特效, 未来只能靠想象力制造爆款了.
    信息渠道被大厂控制, 个人想要爆火只能靠各种噱头了, 大厂想封杀你轻而易举, 普通开发者只能在夹缝里生存了
    my101du
        23
    my101du  
       7h 58m ago
    人类大脑的想象力、创造力、精力已经到头了。

    接下来人工智能自己创作的东西,如果去探究其内部的形成过程可能我们已经看不懂了,但是它还是会用一部分算力输出人类能看明白的某种形式(图、文、音),剩下的算力鬼知道在干什么。

    它能兼容我们,但它也在飞速进化成另一个物种。

    AI 大帝下令:把整个地球有历史以来的所有信息进行完整全面的一次的排列组合,然后 一 一验证。
    那闪烁的灯光,是新生地球的脉搏。
    AIgogo
        24
    AIgogo  
       2h 28m ago
    大模型炼丹已经卷不出来啥了,iphone14 的能力够用了,有了 iphone17 也改变不了多少
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3311 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 70ms · UTC 12:06 · PVG 20:06 · LAX 05:06 · JFK 08:06
    ♥ Do have faith in what you're doing.