zhwguest
V2EX  ›  OpenAI

续 claude 降智严重后, codex 也在步其后尘

  •  
  •   zhwguest · 11h 36m ago · 3624 views

    你说这是为什么呀为呀么为什么?

    38 replies    2026-05-19 22:51:40 +08:00
    neuthself
        1
    neuthself  
       11h 32m ago
    可能是算力不够?
    MX123
        2
    MX123  
       11h 30m ago
    这两天 claude 明显比 Codex 强
    lujiaosama
        3
    lujiaosama  
       11h 30m ago
    无它,算力不足,好日子还在后头呢
    longxinglink
        4
    longxinglink  
       11h 25m ago
    我的模型和 Mythos Preview 差在哪里?我的 GPT5.5:这里可能有一个漏洞,根据文档我新建了三个漏洞来修补这个漏洞,Mythos Preview:这里有漏洞,我写了 PoC ,跑通了,还能把它和另一个低危点串成攻击链。
    https://www.v2ex.com/t/1213773#reply1

    GPT 幻觉特别强,经常去用错误文档且不加以检验,也是酱汁导致的吗?
    kloudmuka
        5
    kloudmuka  
       11h 24m ago
    GPT 这两天拉完了,吐一大堆没用的垃圾,又只能回去用 Claude 了
    MuyuQ
        6
    MuyuQ  
       10h 49m ago
    这两天 image2 也经常抽风。
    deplives
        7
    deplives  
       10h 46m ago
    gpt 的降职已经不是这几天才开始的,我的官方 gpt 已经吃灰很久了,上周让他写一个 需求,弯弯绕绕改了一堆又一堆,编译都过不去,最后自己都快无限循环了,claude 4.7 一把梭解决,顺便还找出来了 gpt 写的屎一样代码的 20 多个 bug
    prosgtsr
        8
    prosgtsr  
       10h 46m ago
    一般都是有新模型在研发中,占用算力了
    qingjin
        9
    qingjin  
       10h 41m ago
    算力倾斜,逼你用更高倍的新模型。
    evan1
        10
    evan1  
    PRO
       10h 33m ago
    gpt 是最先开启降智的。。。好几年了都。

    当时 claude 还只会封号。
    evan1
        11
    evan1  
    PRO
       10h 32m ago
    可能是为了节省成本。
    bush911
        12
    bush911  
       10h 31m ago
    各位大佬,Claude 手机号码验证你们都是去淘宝搞定的吗?
    glouhao
        13
    glouhao  
       10h 2m ago
    其实我感觉啊 这几家都是刚发布出来新东西可劲搞 后面慢慢下滑
    kkth
        14
    kkth  
       9h 26m ago
    哇擦,难怪这几天感觉不对劲,这可咋办呀
    zhwguest
        15
    zhwguest  
    OP
       9h 7m ago
    最恐怖的事情是,网络明明牛逼轰轰,但是广大码畜只能使用弱智工具了。
    xjoker
        16
    xjoker  
       9h 4m ago
    怪了 我今天体感是 GPT 比 Claude 好用
    imchrisorz
        17
    imchrisorz  
       8h 57m ago
    这两天感觉 Codex 确实有点降智,一个需求怎么讲都讲不明白,plan 生成质量很差
    huangpingdong
        18
    huangpingdong  
       8h 49m ago
    @MX123 claude 不是租到了马斯克的算力了吗
    chunqiuyiyu
        19
    chunqiuyiyu  
       8h 45m ago
    现在真的蠢得用不了……
    JerningChan
        20
    JerningChan  
       8h 44m ago
    感觉本地部署的 qwen3.6-27b 都比 opus 4.7 要用,写代码的话

    今天消耗了 21%的 token opus4.7 居然对话了 3 次都处理不好一个 bug ,还来来回回 3 次都说他已经修改了代码,看输出他是改了,但是完全不知道他改的什么东西,反正就是没效果

    然后,换回本地 qwen3.6-27b 一次解决问题
    NerbraskaGuy
        21
    NerbraskaGuy  
       8h 40m ago
    感觉都在试探用户底线,测试降智到哪种程度会导致用户流失太多,用来制定成本。
    x86
        22
    x86  
       8h 39m ago
    故意开白嫖的口子呗,这个月到期不续费,不如白嫖
    iFlicker
        23
    iFlicker  
       8h 39m ago
    新模型训练会占用大量算力
    MEIerer
        24
    MEIerer  
       8h 28m ago
    额度又少,还降智,难受
    jackqian
        25
    jackqian  
       8h 27m ago
    我一直用 xhigh ,没感觉到降智
    diudiuu
        26
    diudiuu  
       8h 23m ago
    @JerningChan 方便分享一下哪个量化版本的吗
    JerningChan
        27
    JerningChan  
       7h 39m ago
    @diudiuu 就用 unsloth 的 Qwen3.6-27B-UD-Q4_K_XL.gguf 就很不错,我家里自己用的 35b-a3b 也很不错
    teaguexiao
        28
    teaguexiao  
       7h 32m ago
    这种节点通常是新版本发布前后的算力调度问题,Claude Sonnet 4 发布前 3.7 也来过一次差不多的波动。等一周左右一般会恢复,实在不行就先请 ds v4 我来做客。
    wdv2ly
        29
    wdv2ly  
       5h 47m ago via Android
    同感,Opus 4.7 明显比之前苯了很多,现在有点像豆包了,说啥只会迎合
    diudiuu
        30
    diudiuu  
       5h 44m ago
    @JerningChan #27 一会在本地试下
    commoccoom
        31
    commoccoom  
       5h 43m ago
    @JerningChan 请问下 3060 12G 能跑吗😂
    iorilu
        32
    iorilu  
       4h 19m ago
    不会把, 真不如本地

    这两公司得瞬间破产
    icaca
        33
    icaca  
       4h 0m ago
    一两周前就降智了
    JerningChan
        34
    JerningChan  
       3h 57m ago
    @commoccoom 不太行喔,除非你把大部分的层卸载到 cpu+内存,这样稠密型的模型就会比较慢了,moe 的话,我就不太清楚,我之前是 1660s 6g ,跑那种 9b 模型,设大了上下文,就得卸载到 cpu ,就会很慢
    JerningChan
        35
    JerningChan  
       3h 54m ago
    @iorilu 你自己试试就知道了,问题是即便你想 27b 用的爽,不想折腾,单卡跑,成本是多少?随便起码一张 4090 吧,反正我自己用 2080ti 22g 跑 27b 模型,都只有 20t/s 左右,要用得爽,起码 60t/s 才有一点点效率
    sead
        36
    sead  
       2h 55m ago
    最近写的确实缺点意思, 我还以为是错觉。。。
    chen27
        37
    chen27  
       2h 47m ago
    算力用来训新模型了
    eventlooped
        38
    eventlooped  
       2h 46m ago
    我最近觉得 claude 比 gpt 强太多了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1258 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 90ms · UTC 17:38 · PVG 01:38 · LAX 10:38 · JFK 13:38
    ♥ Do have faith in what you're doing.