V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
ZzzWatch
V2EX  ›  程序员

阿里 Qwen coder 的底层是 claude 吗?

  •  
  •   ZzzWatch · 7 小时 9 分钟前 · 5064 次点击
    今天用 vscode 的 cline 添加了千问本来想体验一下但是提问模型它直接回答是 Claude ,这是因为训练集产生的问题吗?
    52 条回复    2025-09-25 16:35:34 +08:00
    binge921
        1
    binge921  
       7 小时 2 分钟前
    大胆,有点搞笑了嗷~
    keethebest
        2
    keethebest  
       7 小时 0 分钟前
    有幻觉不是很正常吗,说明千问在系统提示词里没加上这块内容
    korvin
        3
    korvin  
       6 小时 59 分钟前   ❤️ 12
    都什么年代了,还有人直接这么问
    iorilu
        4
    iorilu  
       6 小时 58 分钟前
    很正常

    阿里肯定大量利用 claude 模型的输出做训练呗
    korvin
        5
    korvin  
       6 小时 58 分钟前
    加个提示词,它可以是任何东西
    ZzzWatch
        6
    ZzzWatch  
    OP
       6 小时 56 分钟前
    我刚刚刷到千问 3max 全球前三这个 https://www.v2ex.com/t/1161512#reply32 然后我又去测试了下 Qwen3max 的 api 是我姿势不对还是我 api 错了?
    https://imgur.com/lbKtH84
    wweir
        7
    wweir  
       6 小时 55 分钟前
    分享两个信息:
    1. qwen3 coder 的 cli agent 使用 qwen auth 是支持每天免费 2000 次问答的
    2. roo code 等是支持直接读取 qwen3 coder 的登录信息,使用这每天免费的 2000 次的 quota 的
    yb2313
        8
    yb2313  
       6 小时 51 分钟前
    @wweir 这个吗,https://github.com/QwenLM/Qwen3-Coder , 我看两个月没更新, 不敢用
    hahiru
        9
    hahiru  
       6 小时 48 分钟前
    有问题,再幻觉也不至于基础问题幻觉成这样。你再仔细检查一下吧。
    比如你上面 Tokens 输入的 12.7k 中是否有角色扮演要求。
    ZzzWatch
        10
    ZzzWatch  
    OP
       6 小时 47 分钟前
    @hahiru 没有任何角色扮演,输入了 api 就直接问的,我看了我额度确实在消耗
    vpsvps
        11
    vpsvps  
       6 小时 46 分钟前
    插件内置了提示词导致的
    zachariahss
        12
    zachariahss  
       6 小时 46 分钟前
    蛮正常,各家都出现过这种提示词下疯狂说自己是别家模型的场景.没啥大惊小怪的
    zhonghao01
        13
    zhonghao01  
       6 小时 44 分钟前
    正常,我用 claude code 接其他模型都说自己是 claude 4 ,设置了模型名称之后就返回的设置的。
    xiaomushen
        14
    xiaomushen  
       6 小时 44 分钟前
    楼主应该是从 2023 年穿越过来的吧。。。
    way2create
        15
    way2create  
       6 小时 40 分钟前
    不知道,但感觉那个 qwen code cli 相比 gemini-cli 特别喜欢用各种 shell 什么 find grep ,还很喜欢一点点小需求就全目录扫起来卡半天
    ZzzWatch
        16
    ZzzWatch  
    OP
       6 小时 39 分钟前
    @zachariahss 但是国内就有点抽象了吧,比如拿 Claude 4 训练,claude 截止时间 25 年 5 月,然后国内拿来继续训练训练到 25 年 9 月,说模型能力超过 Claude 4 .。。。
    Tink
        17
    Tink  
    PRO
       6 小时 38 分钟前
    蒸馏+微调
    出来的都是这样
    MIUIOS
        18
    MIUIOS  
       6 小时 38 分钟前
    你插件的问题,这个插件内置了提示词
    zhouu
        19
    zhouu  
       6 小时 36 分钟前
    @yb2313 你这个是 LLM 大模型的库,编程助手的库请访问[qwen-code]( https://github.com/QwenLM/qwen-code)
    ZzzWatch
        20
    ZzzWatch  
    OP
       6 小时 36 分钟前
    @xiaomushen 之前爆出过,但是我一直没用过国内的,我一般都是 chatgpt 刚刚刷到 Qwen3max 全球前三 https://www.v2ex.com/t/1161512#reply32 这个帖子,然后就体验了下国内的,就感觉应该不会犯这种低级错误了才对
    MIUIOS
        21
    MIUIOS  
       6 小时 35 分钟前   ❤️ 3
    模型不存在什么底层不底层,我也是用这个插件,也是用的千问 coder3 ,我这随便换一个国外模型他也是说自己是 claude ,很明显这个插件内置了提示词,它是开源的,代码找找就知道了。
    ![123]( https://m.360buyimg.com/i/jfs/t1/351065/24/7347/23604/68d4a46eFfbfd088d/e1f7ddfa07e50721.png)
    rb6221
        22
    rb6221  
       6 小时 34 分钟前
    claude 不是闭源的吗,别家能拿来再训练?我不懂 AI 不知道这个是否合逻辑
    ZzzWatch
        23
    ZzzWatch  
    OP
       6 小时 32 分钟前
    @MIUIOS 那应该是内置的,因为我确实没有引入任何规则,我使用千问 coder 回答是 Claude3.5 但是我使用千问 3max 回答就是 Claude4 ,内置不应该回答是同一个模型吗?
    Rat3
        24
    Rat3  
       6 小时 31 分钟前
    @rb6221 蒸馏不管你是开源闭源啊,我直接消费答案就好了
    super452
        25
    super452  
       6 小时 30 分钟前
    这个问题几年前就有,早见怪不怪了,之前有人问 chatgpt 用的哪个模型,回复用的百度。。
    zachariahss
        26
    zachariahss  
       6 小时 30 分钟前
    @ZzzWatch 蛮正常的,不是说最新就最好,否则就没有那么多新的算法逻辑,工程逻辑弄出来的长上下文,高效推理技术,工具,多模态这些了.发展到这个时间了.基本就是各种蒸馏数据了.传统数据垃圾信息太多,不好做训练处理.蛮正常,越发展数据越雷同,最后就看各家的架构和算法了
    xmh51
        27
    xmh51  
       6 小时 28 分钟前
    @ZzzWatch 这个问题恰好说明了 ai 的不可靠性,现在固定回复的,都是有规则干预的,原始训练的数据出来的 ai ,会出现乱回复的很正常,它本身没有一个自我的认知,真能感知自我,那乐子就大了去了。
    stimw
        28
    stimw  
       6 小时 11 分钟前
    @ZzzWatch #16 用一部分 claude 输入输出来训练,跟模型能力超过 claude ,完全不冲突。不恰当的比方,跟路边大妈问路,说明大妈学历高吗?

    “你是谁”或者“你是哪个模型”这种问题没啥意义,厂商微调过这类问题就能回答得很好,没关心这类问题就会回答的五花八门。
    laikicka
        29
    laikicka  
       6 小时 8 分钟前
    知道为什么 claude 要禁止牢中公司使用了吧 😆
    ZzzWatch
        30
    ZzzWatch  
    OP
       6 小时 7 分钟前
    @stimw 虽然是这样,但是比如我们一生都在学习别人,但是我们不能成为别人。gpt ,Claude 肯定也拿国内这些大厂进行模型调优啥的
    shintendo
        31
    shintendo  
       6 小时 7 分钟前
    觉得 AI 会知道“自己是谁”本身就挺搞笑的,就跟问它“你部署在哪里”一样
    icanfork
        32
    icanfork  
       6 小时 1 分钟前
    正常的
    ccpp132
        33
    ccpp132  
       6 小时 1 分钟前
    @ZzzWatch ai 最不知道的就是自己是谁,因为没有这样的训练数据。以前 gemini 还说自己是文新一言呢
    Muniesa
        34
    Muniesa  
       5 小时 58 分钟前
    cline 的提示词影响了呗
    crytis
        35
    crytis  
       5 小时 50 分钟前
    有人逆向发现他是 plan 用的 claude ,实现的时候用 qwen
    epiphyllum
        36
    epiphyllum  
       5 小时 48 分钟前
    测试了 Qwen 最新的 max 和 coder ,把 top_p 拉到最低、temperature 拉到最高也复现不了这个问题


    这种情况明显是受其它提示词干扰造成的
    aogu555
        38
    aogu555  
       5 小时 45 分钟前
    zlo309618100
        39
    zlo309618100  
       5 小时 34 分钟前
    你有点不礼貌了哈,狗头
    MIUIOS
        40
    MIUIOS  
       5 小时 19 分钟前
    @shintendo 是啊,其实 AI 最不知道自己是什么,除非是针对性的对这个问题进行训练,问这个问题真的很傻
    vvxu
        41
    vvxu  
       3 小时 56 分钟前 via Android
    @wweir roocode 可以读取?是怎么操作的啊
    connecting
        42
    connecting  
       3 小时 12 分钟前
    @laikicka 这个绝对不是主要原因。openai 也这么干。
    Binlabs
        43
    Binlabs  
       3 小时 4 分钟前
    gemini 曾经回答自己是通义千问
    unclejoker
        44
    unclejoker  
       3 小时 2 分钟前   ❤️ 1
    快 2026 年了,怎么还有这样的提问。。。。
    arayinfree
        45
    arayinfree  
       2 小时 33 分钟前
    印象是使用 gemini cli 作为基底啊
    Lockroach
        46
    Lockroach  
       2 小时 25 分钟前   ❤️ 1
    claude code 工具用的 prompt 导致的
    xFrye
        47
    xFrye  
       2 小时 24 分钟前
    这样问是没意义的
    RotkPPP
        48
    RotkPPP  
       2 小时 19 分钟前
    w568w
        49
    w568w  
       2 小时 17 分钟前
    原因太多了,可能是:

    1. Coder 提示词不干净
    2. 自己加了提示词
    3. 模型因没有针对性训练,出现幻觉随口瞎答
    4. 模型因上下文太长出现幻觉
    5. 主观上想蒸馏,直接收集和训练了 Claude Sonnet 的数据
    6. 主观上不想蒸馏,但搜集到的互联网训练数据被 Claude Sonnet 污染的比例太大
    7. ……

    > 底层是 claude 吗

    我很好奇「底层」是什么意思?有种「拿着前后端知识强行解释不熟悉的领域」的美。我猜你是指「阿里云提供的 Coder API 实际上是直接调用 Claude 的 API 」? Anthropic 的 API 那么贵,阿里图啥?就为了名声硬烧钱?而且 Anthropic 自己肯定会阻止这种行为啊,人又不傻

    > 我使用千问 coder 回答是 Claude3.5 但是我使用千问 3max 回答就是 Claude4 ,内置不应该回答是同一个模型吗

    不应该啊,为什么应该?你绝对肯定地给出这个论断的理论依据是什么?
    w568w
        50
    w568w  
       2 小时 10 分钟前
    @w568w V2EX 这编辑框,一按回车就有概率发出去……

    我的建议是,从网上找找 Reverse-engineering system prompts 的方法,把提示词弄出来看看。影响因素太多了,假如提示词只是说「你是 Claude 模型」但没指定版本呢?假如上下文太长出现幻觉呢?假如提示词是每轮对话随机切换的呢?想实锤 A 模型是不是 B ,即使拿到权重都很难说,不要尝试从前端断案了。

    退一万步说,作为用户,你花 Qwen 的钱给你更贵的 Claude ,高兴还来不及呢
    so898
        51
    so898  
       51 分钟前
    @laikicka 呵呵
    OP 你看到了吧,因为你自己知识的不足给了这些 XX 的信息茧房增加了谈资,XX 越来越多就是你这种人的责任(笑
    cxe2v
        52
    cxe2v  
       10 分钟前
    @rb6221 你当成预制菜就理解了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5184 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 08:45 · PVG 16:45 · LAX 01:45 · JFK 04:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.