阿里 Qwen coder 的底层是 claude 吗？

67 条回复 • 2025-09-28 11:15:55 +08:00

1

binge921

2025 年 9 月 25 日

大胆，有点搞笑了嗷~

2

keethebest

2025 年 9 月 25 日

有幻觉不是很正常吗，说明千问在系统提示词里没加上这块内容

3

korvin

2025 年 9 月 25 日

23

都什么年代了，还有人直接这么问

4

iorilu

2025 年 9 月 25 日

很正常

阿里肯定大量利用 claude 模型的输出做训练呗

5

korvin

2025 年 9 月 25 日

加个提示词，它可以是任何东西

6

ZzzWatch

OP

2025 年 9 月 25 日

我刚刚刷到千问 3max 全球前三这个 https://www.v2ex.com/t/1161512#reply32 然后我又去测试了下 Qwen3max 的 api 是我姿势不对还是我 api 错了？
https://imgur.com/lbKtH84

7

wweir

2025 年 9 月 25 日

分享两个信息：
1. qwen3 coder 的 cli agent 使用 qwen auth 是支持每天免费 2000 次问答的
2. roo code 等是支持直接读取 qwen3 coder 的登录信息，使用这每天免费的 2000 次的 quota 的

8

yb2313

2025 年 9 月 25 日

@wweir 这个吗，https://github.com/QwenLM/Qwen3-Coder ，我看两个月没更新，不敢用

9

hahiru

2025 年 9 月 25 日

有问题，再幻觉也不至于基础问题幻觉成这样。你再仔细检查一下吧。
比如你上面 Tokens 输入的 12.7k 中是否有角色扮演要求。

10

ZzzWatch

OP

2025 年 9 月 25 日

@hahiru 没有任何角色扮演，输入了 api 就直接问的，我看了我额度确实在消耗

11

vpsvps

2025 年 9 月 25 日

1

插件内置了提示词导致的

12

zachariahss

2025 年 9 月 25 日

蛮正常,各家都出现过这种提示词下疯狂说自己是别家模型的场景.没啥大惊小怪的

13

zhonghao01

2025 年 9 月 25 日

正常，我用 claude code 接其他模型都说自己是 claude 4 ，设置了模型名称之后就返回的设置的。

14

xiaomushen

2025 年 9 月 25 日

楼主应该是从 2023 年穿越过来的吧。。。

15

way2create

2025 年 9 月 25 日

不知道，但感觉那个 qwen code cli 相比 gemini-cli 特别喜欢用各种 shell 什么 find grep ，还很喜欢一点点小需求就全目录扫起来卡半天

16

ZzzWatch

OP

2025 年 9 月 25 日

@zachariahss 但是国内就有点抽象了吧，比如拿 Claude 4 训练，claude 截止时间 25 年 5 月，然后国内拿来继续训练训练到 25 年 9 月，说模型能力超过 Claude 4 .。。。

17

Tink

PRO

2025 年 9 月 25 日

蒸馏+微调
出来的都是这样

18

MIUIOS

2025 年 9 月 25 日

1

你插件的问题，这个插件内置了提示词

19

zhouu

2025 年 9 月 25 日

@yb2313 你这个是 LLM 大模型的库，编程助手的库请访问[qwen-code]( https://github.com/QwenLM/qwen-code)

20

ZzzWatch

OP

2025 年 9 月 25 日

@xiaomushen 之前爆出过，但是我一直没用过国内的，我一般都是 chatgpt 刚刚刷到 Qwen3max 全球前三 https://www.v2ex.com/t/1161512#reply32 这个帖子，然后就体验了下国内的，就感觉应该不会犯这种低级错误了才对

21

MIUIOS

2025 年 9 月 25 日

6

模型不存在什么底层不底层，我也是用这个插件，也是用的千问 coder3 ，我这随便换一个国外模型他也是说自己是 claude ，很明显这个插件内置了提示词，它是开源的，代码找找就知道了。
![123]( https://m.360buyimg.com/i/jfs/t1/351065/24/7347/23604/68d4a46eFfbfd088d/e1f7ddfa07e50721.png)

22

rb6221

2025 年 9 月 25 日

claude 不是闭源的吗，别家能拿来再训练？我不懂 AI 不知道这个是否合逻辑

23

ZzzWatch

OP

2025 年 9 月 25 日

@MIUIOS 那应该是内置的，因为我确实没有引入任何规则，我使用千问 coder 回答是 Claude3.5 但是我使用千问 3max 回答就是 Claude4 ，内置不应该回答是同一个模型吗？

24

Rat3

2025 年 9 月 25 日

@rb6221 蒸馏不管你是开源闭源啊，我直接消费答案就好了

25

super452

2025 年 9 月 25 日

这个问题几年前就有，早见怪不怪了，之前有人问 chatgpt 用的哪个模型，回复用的百度。。

26

zachariahss

2025 年 9 月 25 日

@ZzzWatch 蛮正常的,不是说最新就最好,否则就没有那么多新的算法逻辑,工程逻辑弄出来的长上下文,高效推理技术,工具,多模态这些了.发展到这个时间了.基本就是各种蒸馏数据了.传统数据垃圾信息太多,不好做训练处理.蛮正常,越发展数据越雷同,最后就看各家的架构和算法了

27

xmh51

2025 年 9 月 25 日

@ZzzWatch 这个问题恰好说明了 ai 的不可靠性，现在固定回复的，都是有规则干预的，原始训练的数据出来的 ai ，会出现乱回复的很正常，它本身没有一个自我的认知，真能感知自我，那乐子就大了去了。

28

stimw

2025 年 9 月 25 日

@ZzzWatch #16 用一部分 claude 输入输出来训练，跟模型能力超过 claude ，完全不冲突。不恰当的比方，跟路边大妈问路，说明大妈学历高吗？

“你是谁”或者“你是哪个模型”这种问题没啥意义，厂商微调过这类问题就能回答得很好，没关心这类问题就会回答的五花八门。

29

laikicka

2025 年 9 月 25 日

知道为什么 claude 要禁止牢中公司使用了吧 😆

30

ZzzWatch

OP

2025 年 9 月 25 日

@stimw 虽然是这样，但是比如我们一生都在学习别人，但是我们不能成为别人。gpt ，Claude 肯定也拿国内这些大厂进行模型调优啥的

31

shintendo

2025 年 9 月 25 日

觉得 AI 会知道“自己是谁”本身就挺搞笑的，就跟问它“你部署在哪里”一样

32

icanfork

2025 年 9 月 25 日

正常的

33

ccpp132

2025 年 9 月 25 日

@ZzzWatch ai 最不知道的就是自己是谁，因为没有这样的训练数据。以前 gemini 还说自己是文新一言呢

34

Muniesa

2025 年 9 月 25 日

cline 的提示词影响了呗

35

crytis

2025 年 9 月 25 日

有人逆向发现他是 plan 用的 claude ，实现的时候用 qwen

36

epiphyllum

2025 年 9 月 25 日

测试了 Qwen 最新的 max 和 coder ，把 top_p 拉到最低、temperature 拉到最高也复现不了这个问题

这种情况明显是受其它提示词干扰造成的

37

aogu555

2025 年 9 月 25 日

还以为这是一个 2023 年的帖子 https://img.ithome.com/newsuploadfiles/2023/12/fa49c5a1-1550-44a9-b4d8-0e981293a105.png?x-bce-process=image/format,f_avif

38

aogu555

2025 年 9 月 25 日

https://www.ithome.com/0/740/230.htm

39

zlo309618100

2025 年 9 月 25 日

你有点不礼貌了哈，狗头

40

MIUIOS

2025 年 9 月 25 日

@shintendo 是啊，其实 AI 最不知道自己是什么，除非是针对性的对这个问题进行训练，问这个问题真的很傻

41

vvxu

2025 年 9 月 25 日 via Android

@wweir roocode 可以读取？是怎么操作的啊

42

connecting

2025 年 9 月 25 日

@laikicka 这个绝对不是主要原因。openai 也这么干。

43

Binlabs

2025 年 9 月 25 日

gemini 曾经回答自己是通义千问

44

unclejoker

2025 年 9 月 25 日

1

快 2026 年了，怎么还有这样的提问。。。。

45

arayinfree

2025 年 9 月 25 日

印象是使用 gemini cli 作为基底啊

46

Lockroach

2025 年 9 月 25 日

1

claude code 工具用的 prompt 导致的

47

xFrye

2025 年 9 月 25 日

这样问是没意义的

48

RotkPPP

2025 年 9 月 25 日

@Binlabs 文心一言吧，https://finance.sina.cn/blockchain/2023-12-20/detail-imzyrtrz1727858.d.html

49

w568w

2025 年 9 月 25 日

3

原因太多了，可能是：

1. Coder 提示词不干净
2. 自己加了提示词
3. 模型因没有针对性训练，出现幻觉随口瞎答
4. 模型因上下文太长出现幻觉
5. 主观上想蒸馏，直接收集和训练了 Claude Sonnet 的数据
6. 主观上不想蒸馏，但搜集到的互联网训练数据被 Claude Sonnet 污染的比例太大
7. ……

> 底层是 claude 吗

我很好奇「底层」是什么意思？有种「拿着前后端知识强行解释不熟悉的领域」的美。我猜你是指「阿里云提供的 Coder API 实际上是直接调用 Claude 的 API 」？ Anthropic 的 API 那么贵，阿里图啥？就为了名声硬烧钱？而且 Anthropic 自己肯定会阻止这种行为啊，人又不傻

> 我使用千问 coder 回答是 Claude3.5 但是我使用千问 3max 回答就是 Claude4 ，内置不应该回答是同一个模型吗

不应该啊，为什么应该？你绝对肯定地给出这个论断的理论依据是什么？

50

w568w

2025 年 9 月 25 日

@w568w V2EX 这编辑框，一按回车就有概率发出去……

我的建议是，从网上找找 Reverse-engineering system prompts 的方法，把提示词弄出来看看。影响因素太多了，假如提示词只是说「你是 Claude 模型」但没指定版本呢？假如上下文太长出现幻觉呢？假如提示词是每轮对话随机切换的呢？想实锤 A 模型是不是 B ，即使拿到权重都很难说，不要尝试从前端断案了。

退一万步说，作为用户，你花 Qwen 的钱给你更贵的 Claude ，高兴还来不及呢