V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Zhipuai
V2EX  ›  程序员

GLM-5 开源:从代码到工程, Agentic Engineering 时代最好的开源模型

  •  
  •   Zhipuai ·
    PRO
    · 20 小时 26 分钟前 · 3433 次点击

    今天,我们上线并开源 GLM-5 。

    学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即从“Vibe Coding”变革为“Agentic Engineering”。

    GLM-5 正是这一变革的产物:在 Coding 与 Agent 能力上,取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5 ,擅长复杂系统工程与长程 Agent 任务。

    在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。

    更大基座,更强智能

    GLM-5 全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础:

    • 参数规模扩展:从 355B (激活 32B )扩展至 744B (激活 40B ),预训练数据从 23T 提升至 28.5T ,更大规模的预训练算力显著提升了模型的通用智能水平。
    • 异步强化学习:构建全新的“Slime”框架,支持更大模型规模及更复杂的强化学习任务,提升强化学习后训练流程效率;提出异步智能体强化学习算法,使模型能够持续从长程交互中学习,充分激发预训练模型的潜力。
    • 稀疏注意力机制:首次集成 DeepSeek Sparse Attention ,在维持长文本效果无损的同时,大幅降低模型部署成本,提升 Token Efficiency 。

    Coding 能力:对齐 Claude Opus 4.5

    GLM-5 在编程能力上实现了对 Claude Opus 4.5 的对齐,在业内公认的主流基准测试中取得开源模型 SOTA 分数。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.856.2 的开源模型 SOTA 分数,性能超过 Gemini 3 Pro 。

    2026 年,大模型需要从“会写”走到“会完成”,尤其是端到端完成大型任务。GLM-5 是一个“系统架构师”,它不仅为开发精美的 Demo 而生,更为稳定交付生产结果而生。

    在内部 Claude Code 评估集合中,GLM-5 在前端、后端、长程任务等编程开发任务上显著超越 GLM-4.7 (平均增幅超过 20%),能够以极少的人工干预自主完成 Agentic 长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近 Opus 4.5 。

    Agent 能力:SOTA 级长程任务执行

    GLM-5 在 Agent 能力上实现开源 SOTA ,在多个评测基准中取得开源第一:在 BrowseComp (联网检索与信息理解)、MCP-Atlas (工具调用和多步骤任务执行)和 τ²-Bench (复杂多工具场景下的规划和执行)均取得最佳表现。

    在衡量模型经营能力的 Vending Bench 2 中,GLM-5 获得开源模型第一的表现。Vending Bench 2 要求模型在一年期内经营一个模拟的自动售货机业务,GLM-5 最终账户余额达到 4432 美元,经营表现接近 Claude Opus 4.5 ,展现了出色的长期规划和资源管理能力。

    这些能力是 Agentic Engineering 的核心:模型不仅要能写代码、完成工程,还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系,成为真正的 Agentic Ready 基座模型。

    国产芯片支持线上推理集群

    GLM 系列模型受到全球开发者喜爱,在 GLM Coding Plan 全球爆量后,我们不得不启动限售活动。本次 GLM-5 的上线依托众多国产芯片有力保障了线上服务的稳定和高效。

    目前,GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5 在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。

    Agentic Engineering 典型场景

    点击或在浏览器输入:showcase.z.ai,即可查看所有案例。

    开源与使用方式

    即日起,GLM-5 在 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License 。

    GLM-5 已经纳入 Max 用户套餐,Pro 将尽快在 5 天内支持,接下来我们将逐步扩大范围,尽力让更多用户体验并使用 GLM-5 。GLM Coding Plan 支持 Claude Code 、OpenCode 等主流开发工具。

    GLM Coding Plan 同步升级 Agentic Engineering 体验:

    • 官方适配 OpenClaw:仅需简单几步即可完成配置,快速开启 Agent 工作流;
    • Pro / Max 用户限量赠送 AutoGLM-OpenClaw:支持将云端个人 AI 助手接入飞书,实现办公场景的长任务执行;
    • 新增 GLM in Excel 权益:原生适配 Excel 环境的 AI 插件,支持在侧边栏以自然语言交互,深度赋能数据处理与表格工作流( Beta 期仅 Max 用户可享套餐抵扣)。

    1. 官方 API 接入

    2. 在线体验

    3. 开源链接

    4. Agent

    5. Blog

    48 条回复    2026-02-13 11:53:37 +08:00
    shakaraka
        1
    shakaraka  
    PRO
       20 小时 25 分钟前
    试用套餐有不
    shakaraka
        2
    shakaraka  
    PRO
       20 小时 24 分钟前
    code plan 的试用 GLM-5 的
    Tink
        3
    Tink  
    PRO
       20 小时 10 分钟前 via Android
    lite 和 pro 都不支持
    donggua997
        4
    donggua997  
       20 小时 7 分钟前   ❤️ 21
    比参数没输过,实际体验没赢过。
    enano
        5
    enano  
       20 小时 5 分钟前
    开了 lite 像路边一条
    whbbxw
        6
    whbbxw  
       20 小时 3 分钟前
    你们自己用自己的模型吗? 4.6 和 5.3 也参与一下测试吧。
    donggua997
        7
    donggua997  
       20 小时 0 分钟前
    你真的确定配与 gpt 、gemini 、claude 放一起比吗 ???
    mashimaroinfo1
        8
    mashimaroinfo1  
       19 小时 59 分钟前
    篇幅好长, 能力几何?
    opeth
        9
    opeth  
       19 小时 53 分钟前
    先看看隔壁帖子对你们 coding plan 的背刺的吐槽吧
    hugodotlau
        10
    hugodotlau  
       19 小时 51 分钟前
    来吹半天都没点福利抽奖么?这广告真白看了
    zhuangpipi
        11
    zhuangpipi  
       19 小时 26 分钟前
    不涨价还想购入,涨价确实性价比比较低了
    qaq13037
        12
    qaq13037  
       19 小时 7 分钟前
    跑分嘎嘎猛,实际用起来差很多
    iorilu
        13
    iorilu  
       18 小时 55 分钟前
    我一直奇怪, 100 多可以上车正规的 google one 会员, 用 antigravity 不比这个强, 更别说谷歌还有很多其他 ai 服务?
    flowerwow0316
        14
    flowerwow0316  
       18 小时 55 分钟前 via Android
    你说是就是了
    Muninn
        15
    Muninn  
       18 小时 48 分钟前   ❤️ 1
    现在这个价格完全没有竞争力了。更何况口碑已经完全坏了,超卖,水军营销,限速,降智,随意修改订阅协议,毫无诚信,吃相难看。
    ProphetN
        16
    ProphetN  
       18 小时 33 分钟前
    吃相太难看了,国产模型商永久拉黑这家吧。
    iden
        17
    iden  
       18 小时 28 分钟前
    ...评论哪儿来的那么大偏见。刷分不都是闭源模型常见的操作吗?
    众所周知开源模型刷分风险更低,也能被吐槽高分低能?
    tlerbao
        18
    tlerbao  
       18 小时 24 分钟前
    吹你家死牛逼
    Plutooo
        19
    Plutooo  
       17 小时 10 分钟前
    是蒸馏模型吗
    felixcode
        20
    felixcode  
       16 小时 58 分钟前
    用起来怎么样,能不能和 gpt 和 opus 比,自己心里没数吗?
    phrack
        21
    phrack  
       16 小时 51 分钟前
    虽然不咋样收费还贵

    但是开源我就喜欢,等显存便宜了 1TB 我也买得起的时候本地试试
    mogutouer
        22
    mogutouer  
       16 小时 16 分钟前
    4.5 都废了,你怎么不对比同时代的 opus 4.6 ?
    Dream4U
        23
    Dream4U  
       16 小时 9 分钟前
    蒸馏对齐
    jqknono
        24
    jqknono  
       15 小时 39 分钟前
    从 300B 涨到 700B, 涨价还算合理吧, 重要的是模型效果.
    unifly
        25
    unifly  
       14 小时 2 分钟前   ❤️ 2
    咋一个个都这么大戾气,不会是跟贴机器人吧,凡是跟老美有竞争的,网上舆论没有不被骂的……嘿嘿
    felixcode
        26
    felixcode  
       11 小时 19 分钟前   ❤️ 1
    @bridgemindai
    BridgeMind 发的测评和榜单,就这还在这腆着脸吹?


    kneo
        27
    kneo  
       10 小时 14 分钟前 via Android   ❤️ 2
    多个选择总是好的,没必要喷这么狠吧。我在 hackernews 上经常看老外盛赞中国开源模型,说现想跑本地大模型只能靠中国的开源模型。虽然比不上闭源模型,但只要和自己比是在进步,对他们来说就是个好消息。
    longxk
        28
    longxk  
       9 小时 20 分钟前 via Android   ❤️ 1
    LITE 套餐我明明记得之前写着支持最新模型,结果现在偷偷改成支持历史模型,这种毫无诚信可言的公司的产品也必然是注水严重。
    jokcylou
        29
    jokcylou  
       6 小时 41 分钟前 via Android   ❤️ 2
    @kneo v 站站不起来的人可太多了,不会念国产一点点好的,国产往死里挑刺国外往死里舔,老传统了
    maolon
        30
    maolon  
       5 小时 24 分钟前   ❤️ 1
    @unifly 你自己搜下他们最近干了啥就知道为什么骂了,看样子割韭菜没割到你头上说话就是轻松,啥事都来个什么大国叙事 smh
    securityCoding
        31
    securityCoding  
       4 小时 41 分钟前 via Android   ❤️ 4
    @maolon 宏大叙事的基本没脑子🤣,付费用户条款随意改不喷留着过年
    maolon
        32
    maolon  
       4 小时 34 分钟前
    @securityCoding 还真是留着过年 😂,过年前都要给用户添波堵你们智谱是有水平的
    8e47e42
        33
    8e47e42  
       4 小时 16 分钟前
    @jokcylou Yes this - 我是真的看不懂,但凡人有护照也不至于这样
    ckzx
        34
    ckzx  
       4 小时 12 分钟前
    这就是一家骗子公司。。我也上当买了 LITE 。当时也写了支持最新的。
    gux928
        35
    gux928  
       3 小时 59 分钟前 via iPhone
    我也买了 lite 。让子弹飞两天看看。
    AlexHsu
        36
    AlexHsu  
       3 小时 33 分钟前
    不如 minimax2.5
    FH0
        37
    FH0  
       3 小时 22 分钟前
    之前开过你们家的 Max 套餐,GLM 4.7 的速度很慢
    EasonYan
        38
    EasonYan  
       2 小时 25 分钟前
    Lite 套餐不让用。不过无所谓,4.7 都慢得没法用,就算让用 5 也不想用了。
    EeveeRibbon
        39
    EeveeRibbon  
       2 小时 13 分钟前
    @unifly #25 GLM4.6 我是真掏钱用过的,还好没买年费,从此以后我不信任 GLM 的任何模型了
    MaxwellX
        40
    MaxwellX  
       2 小时 3 分钟前
    之前买了 lite 的协议是给更新最新版模型的,现在又不给更新了,还经常来这里打广告,败好感啊
    secretbytes
        41
    secretbytes  
       1 小时 49 分钟前   ❤️ 1
    怎么感觉有点像某个手机品牌,都是参数如何如何牛逼,跑分如何如何,等你买回去了,就会发现一坨。要是你说它不好,还有人出来说它才多少钱啊,你拿它跟 XXX 比
    felixcode
        42
    felixcode  
       1 小时 48 分钟前
    不好好做产品只知道吹的,不管产品质量只顾吹国产的,非蠢即坏。
    LunarEcho24
        43
    LunarEcho24  
       1 小时 25 分钟前
    吹的有点过了
    zxjxzj9
        44
    zxjxzj9  
       1 小时 17 分钟前
    @unifly 我看用过 GLM 的就没有不骂的,怎么都是国产 minimax 和 qwen 还有 kimi 好评就很多呢?尤其是 minimax ,人家股价也高说明真金白银看好,只不过没有那么多宣传罢了。
    crackidz
        45
    crackidz  
       1 小时 16 分钟前
    @secretbytes 你这样说发烧手机可就急眼了
    justdoit123
        46
    justdoit123  
       1 小时 1 分钟前
    试用了下,响应真的太慢了啊,这个真的有点不能忍。是不是试用套餐的缘故?
    gouLang
        47
    gouLang  
       57 分钟前
    2.12 号买的 lite 还增加了周限额, 5 小时限额里跑满, 就是周限额的 20%, 也就是说一周只能跑 25 个小时, 平均每天只能跑满 5 个小时的量, 这能用来工作? 年费还升价了这么多, 太痛了
    manwhatcanisay
        48
    manwhatcanisay  
       43 分钟前
    广告帖为什么不放在“推广" 这又不是隔壁,没有“国产替代”
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2656 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 04:37 · PVG 12:37 · LAX 20:37 · JFK 23:37
    ♥ Do have faith in what you're doing.