V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dudaming
V2EX  ›  问与答

阿里发布 Qwen3Max 性能超 GPT5,全球前三

  •  
  •   dudaming · 31 天前 · 4812 次点击

    刚看新闻,这是真的吗,突然这么厉害 https://t.cj.sina.com.cn/articles/view/1642634100/61e89b7404001jrie

    39 条回复    2025-09-28 19:44:54 +08:00
    dudaming
        1
    dudaming  
    OP
       31 天前
    有没有了解的大佬说说,还是很震惊的
    thedog
        2
    thedog  
       31 天前
    真假都有可能。阿里应该是有这个实力的。不过阿里的 pr 味道很重,也不知道实际测试什么水平。等真出来了,测测就知道了。
    NoobNoob030
        3
    NoobNoob030  
       31 天前
    大概率是真的
    dynastysea
        4
    dynastysea  
       31 天前
    平时日常用 qwen ,gpt5 也用,技术方面 qwen 优势明显,很多技术问题,gpt5 都说的很浅
    xing7673
        5
    xing7673  
       31 天前
    chat 页面上选 qwen3-Max 不支持深度思考,实测的感觉和 instant 模型差不多。

    不知道哪里可以有 thinking 的版本去测试一下
    Meteora626
        6
    Meteora626  
       31 天前
    是 gpt5 太让人失望了,4-5 完全没有体现出实力。Qwen3Max 把参数堆到 t 级 出成果也不意外,看看之前 k2 就是粗暴堆 ds 架构再训练都很不错
    knva
        7
    knva  
       31 天前
    阿里大模型还是没问题的,qwen image 和 wan2.2 都很棒
    coefu
        8
    coefu  
       31 天前
    从 1000 到 10000 的提升,恰恰是我方最擅长的,毋庸置疑。
    fs418082760
        9
    fs418082760  
       31 天前
    中文的 AI 能力害得靠中文训练出来的模型才精准。
    Skifary
        10
    Skifary  
       31 天前
    前三是哪三家🐶
    1una
        11
    1una  
       31 天前
    @Meteora626 堆参数也不是谁都能堆的,还记得 2T 参数的 Llama 4 Behemoth 么?一直延期到现在还没发布
    maolon
        12
    maolon  
       31 天前
    你超了哪个 gpt5 呢?超了 low, medium 还是 high ?这个三个 thinking effort 可是性能天差地别
    全球第三是 chatbot arena 这个现在基本没有参考性的榜
    我不是说 qwen 不行,不如说我一直都在吹 qwen, 但是阿里的稿子还是看看就好
    Parva
        13
    Parva  
       31 天前   ❤️ 4
    同楼上,现在哪家新发一个模型 媒体都是吹得天花乱坠。最后发现还得是 chatgpt+claude
    Rickkkkkkk
        14
    Rickkkkkkk  
       31 天前
    我搜索 chatgpt 链接点开就能用;我搜索 Qwen3Max ,请问?
    hellodigua
        15
    hellodigua  
       31 天前
    woc ,看了标题去试了一下 qwen3-max ,效果真的可以
    Revenant
        16
    Revenant  
       31 天前
    最新版本还没体验过,不过之前版本的 qwen 是 Benchmark 战神,基准没输过,实战没赢过😂,实际体验连 DSv3 都干不过
    june4
        17
    june4  
       31 天前
    @Rickkkkkkk 能上 v2 就别用百度了,官网不是能用吗? https://chat.qwen.ai/
    stinkytofux
        18
    stinkytofux  
       31 天前
    @Rickkkkkkk #14 阿里云百炼上不就有么, 我看到这个帖子就找到了, 还免费. 你不熟是因为你平时不用.

    https://bailian.console.aliyun.com
    Rickkkkkkk
        19
    Rickkkkkkk  
       31 天前
    @june4 你用 google 搜索 Qwen3Max 可以看看前几个结果是啥
    MoozLee
        20
    MoozLee  
       31 天前
    之前的版本,实际使用下一用一个不吱声。
    AutumnVerse
        21
    AutumnVerse  
       31 天前 via iPhone
    以前每次有新模型问世,我都会去尝试一番,现在已经没那个兴趣了,还是 gpt 吧。个个发布会都吹得震天响,真正干活还得 gpt
    june4
        22
    june4  
       31 天前
    @Rickkkkkkk 第一个就是模型的官方发行文档页啊,里面详细介绍了这个模型,以及去哪里用(注明了官方网站版网址和 api 方式用法)
    pGiG2vI1165eY8KI
        23
    pGiG2vI1165eY8KI  
       31 天前
    Qwen3 相关模型是真强,用了有一段时间了。
    Seck
        24
    Seck  
       30 天前 via Android
    哦,我说一下使用感受
    比没上线之前,反正实际效果是好的,这一点毋庸置疑
    就是你经常用阿里 qwen 的话,可以明显体验出来,没上 max 和上 max 过后,有个明显不一样

    但是我不用啊,我只是会在前两名 gemini 以及 GPT5 回答问题实在回答不出来,这个再换一个😂😂😂

    互联网效应,人人都愿意用 top one, top 2 没人记住,何况你这是 top3 ,更没人用🤫🤫🤫
    Seck
        25
    Seck  
       30 天前 via Android
    @AutumnVerse 现在的大模型加入了用户个性化,同一个问题,不同的用户问,也会回答不同的内容。
    你用得越多,越了解你,你越离不开。

    这就是为什么无论你发什么模型,我就用 GPT5🤦‍♂️🤦‍♂️
    clarkethan
        26
    clarkethan  
       30 天前
    @Meteora626 建议多体验下 GPT-5 的 thinking 或者 pro 模型再下这个结论
    pxlxh
        27
    pxlxh  
       30 天前 via iPhone
    前面几楼一股怪味儿
    fivee
        28
    fivee  
       30 天前
    @Rickkkkkkk 你都知道搜 chatgpt 了,都不知道搜 qwen 吗
    byby
        29
    byby  
       30 天前
    纸面上没输过,体验上没赢过
    gpt5
        30
    gpt5  
       30 天前
    又是蒸煮 gpt😏
    gechang
        31
    gechang  
       30 天前
    老板买了 GPT plus 用着还行啊,很多问题一针见血,一条回答就能解决了,其他 AI 得反复问,给报错结果啥的
    lizy0329
        32
    lizy0329  
       30 天前
    先把 循环思考卡死 修复了,再谈其他的吧
    zhouu
        33
    zhouu  
       30 天前
    @xing7673 因为 thinking 版本还在训练,发布的就是指令型模型
    Dawnnnnnn
        34
    Dawnnnnnn  
       30 天前
    你就用吧,一用一个不吱声。
    ludan110
        35
    ludan110  
       30 天前
    cluade chatgpt 应该是公认的前 2 qwen 都超了这两个的 只写前三太保守了
    donglinjieshi
        36
    donglinjieshi  
       30 天前
    我还是喜欢 Grok
    xing7673
        37
    xing7673  
       30 天前
    @zhouu 可以,期待 thinking 的
    mscsky
        38
    mscsky  
       30 天前
    国产也就跑分在赢,文字处理不如 gemini 一毛
    vevlins
        39
    vevlins  
       26 天前
    实测对我来说,Gemini 2.5 pro 是地表最强模型,回答问题不仅很深刻,而且思维非常流畅。同样的问题对比了一下,没感觉 Qwen3 Max 有任何优势。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2561 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 09:56 · PVG 17:56 · LAX 02:56 · JFK 05:56
    ♥ Do have faith in what you're doing.