V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
hrzlvn
V2EX  ›  程序员

国产模型你们试下来谁更强

  •  
  •   hrzlvn · 3 小时 45 分钟前 · 2355 次点击

    我们做的是比较的复杂 agent ,目前试下来 kimi 效果最好

    28 条回复    2026-03-19 13:36:49 +08:00
    m952755064
        1
    m952755064  
       3 小时 42 分钟前
    别的没用过,GLM-5 还不错
    VeteranCat
        2
    VeteranCat  
       3 小时 41 分钟前
    不用纠结,glm kimi 这俩都差不多。 当然能用的话,最好还是 claude 。
    FaustinaD
        3
    FaustinaD  
       3 小时 40 分钟前
    各有各的拉
    wsseo
        4
    wsseo  
       3 小时 38 分钟前
    GLM-5
    新出的 minimax-2.7
    小米新出的 mimo-v2-pro
    doubao-seed-2.0

    如果编程不要用 qwen3.5-plus
    defaw
        5
    defaw  
       3 小时 37 分钟前
    昨晚上开了个 minimax m2.7,比之前的 m2.5 强多了,m2.5 的时候工具调用成功率也就 50%。
    感觉 m2.7 比 glm4.7 强一些,达到 composer1.5 的水平了
    skuuhui
        6
    skuuhui  
       3 小时 37 分钟前
    文无第一。如果是做商业产品,建议用 qwen 系列,并且过段时间你就发现原因了。
    mingtdlb
        7
    mingtdlb  
       3 小时 35 分钟前
    @wsseo 小米,你是来搞笑的吧
    soleils
        8
    soleils  
       3 小时 33 分钟前   ❤️ 2
    @mingtdlb 小米新出的 mimo-v2-pro, 效果不错
    cryptovae
        9
    cryptovae  
       3 小时 33 分钟前
    @wsseo

    哈哈哈哈
    `编程不要用 qwen3.5-plus`
    说明你也被坑到了啊,谁家好人把中英文中间强制加空格啊,真特么够了,一个小特性直接毁掉了一个应用场景
    ddczl
        10
    ddczl  
       3 小时 33 分钟前
    我用的 MiniMax ,满足我 90%的情况。昨天更新的 2.7 我还没怎么试,但是能处理我之前使用 2.5 时一个无法处理的问题了
    liu731
        11
    liu731  
    PRO
       3 小时 33 分钟前
    除去 Qwen 外全部拉跨(最近的 3.5 也跨完了)
    sean250031
        12
    sean250031  
       3 小时 26 分钟前
    投 kimi-k2.5 一票
    catazshadow
        13
    catazshadow  
       3 小时 16 分钟前
    谁偷 claude 偷的多谁好
    tinybaby365
        14
    tinybaby365  
       3 小时 15 分钟前
    QWen3.5 中英文间强加空格不是个案,感觉没训练好就放出来了。
    hrzlvn
        15
    hrzlvn  
    OP
       3 小时 12 分钟前
    @tinybaby365 indeed
    zhonghao01
        16
    zhonghao01  
       3 小时 4 分钟前
    GLM 5 / KIMI ,MINIMAX 中规中矩,其他就不要碰了。
    nnnnnnamgn
        17
    nnnnnnamgn  
       2 小时 47 分钟前
    glm5 凑合用,但贵,minimax 干小活可以
    xyzlucky
        18
    xyzlucky  
       2 小时 41 分钟前
    别的不知道,但是今天用了一下 Qwen3.5-Plus ,no ,不行。。。。。。。看他干活我心累
    redbeetle
        19
    redbeetle  
       2 小时 37 分钟前
    miniMax-M2.5 、KiMI-2.5 使用下来,感觉 KIMI-2.5 更好用些。首先是他的多模态就方便一些,miniIMAX 的 ai 幻觉比 KIMI 更重一点。但 miniMax 有个最大的优点就是便宜量大管饱。智谱的 GLM 没有使用,暂不评论
    fengge0002
        20
    fengge0002  
       2 小时 33 分钟前
    https://v2ex.com/t/1199441
    看看洗车问题的回答对比,kimi 的逻辑推理还是稍微差点。不过做 agent 也许更重要的是指令听从和工具调用能力
    EricSTG
        21
    EricSTG  
       2 小时 27 分钟前
    @skuuhui #6 请问是啥原因
    vthu57924
        22
    vthu57924  
       2 小时 17 分钟前
    感觉目前反馈最好的是 GLM-5
    CANTI
        23
    CANTI  
       1 小时 37 分钟前
    @cryptovae 好奇问下,中英文之间加空格应该是写作排版的常规操作,编程里中英文同时存在应该是注释或者日志?这里会有啥影响呢?
    ffxrqyzby
        24
    ffxrqyzby  
       1 小时 36 分钟前
    我进来之前以为是高达模型呢
    listenerri
        25
    listenerri  
       1 小时 14 分钟前
    @CANTI #23 新改动的代码倒是无所谓,但若是 LLM 擅自修改其他无关代码,甚至其他文件呢,就为了加特么空格

    不过这个问题在 AGENTS.md 里加上限制,不要它随意修改已有代码,也就差不多好了
    dunn
        26
    dunn  
       1 小时 6 分钟前 via Android
    评测每家都很厉害,实际都有差距
    Tink
        27
    Tink  
    PRO
       53 分钟前 via Android
    实测是 kimi2.5 ,一亿有一亿的好
    congyoubanmian
        28
    congyoubanmian  
       24 分钟前
    投 kimi2.5 光他识图不用专门调用 mcp 就比 glm5 和 minimax 强 逻辑上弱 glm5 一点,来自三个包年套餐用户体验
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5476 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 06:01 · PVG 14:01 · LAX 23:01 · JFK 02:01
    ♥ Do have faith in what you're doing.