先说问题,不绕。。。。你们觉得目前你最常用的模型,在开放需求下它的功能、架构设计你能给它定多少年工作经验的程序员(或阿里 P 几水平)。
模型:gpt5.5 中(大部分功能设计,因为便宜),Claude Opus 4.6 我的困境:
当然,上面的所有前提都是一个生产项目和程序员职业。自己 coding 玩具项目或者非程序员岗位不算
1
sentinelK 8h 6m ago
1 、我会干预其架构设计。不是别的,是因为我要为我的 Agent 兜底,他的技术选型我看不懂我就兜不了……
2 、看心情,所以我目前在尝试可能的情况下,让 hermes 接管我的代码仓库和文档,让他帮我去调用 claudeCode/openCode 。我只提需求和把控设计。 3 、同理,hermes 可以大幅度降低人工提供上下文的心智负担。 |
2
someonelikeyouah 8h 4m ago
偏个题,评估这个意义在哪里? 你自己知道上限 下限 能做到哪里就行了,评级是为了给公司指出开发的预算么?
|
3
sentinelK 8h 1m ago
btw:使用大模型,核心矛盾点,就是你需要投入多少精力来进行控制。这和企业管理的底层逻辑相通。
你给员工更大的自由,他就更能发挥上限,代价就是捅娄子的能力也更强。 你越依赖微操,你的员工的能力就越难以发挥,也就越难以突出你的人力优势。这里要 @蒋委员长 |
4
lmmlwen 8h 0m ago
一个小小的程序员如此大放厥词,ai 编码是无上限的,只是你和你们的项目代码过于平庸,它只是选择了一个最为中庸的结果给你。
|
5
lmmlwen 7h 59m ago
阿里 p8 的 py 代码,还得我来修改一轮低级 bug ,这没有任何意义
|
7
skuuhui OP @someonelikeyouah 人类可能是以后公司内唯一需要承担责任的少部分实体。如果一个功能 AI 跑了 2 天,上限直接奔溃了,老板可不会追责 AI
|
9
sentinelK 7h 50m ago
@skuuhui 这个直觉没错的,但是对应的账应该反过来算。
1 、你降低了你自己的心智负担,你就更有时间、精力来给模型兜底。 2 、目前主流的 Agent 思路是 loop + 审核抽卡,所以误差的积累很大程度上可以靠增多多抽卡次数来抹平。也就是靠烧更多的 token 来换你更少的干预。 3 、目前模型的能力更强了,最优解的统计学优势更明显,即便上下文有一系列错误,也会无视或者自行纠错。 |
10
someonelikeyouah 7h 50m ago
@skuuhui #7 可行性分析现在是开发来主导了么?
|
11
teaguexiao 7h 36m ago
我的做法是先让 AI 出两三个方案,我挑一个架构方向再让它深入,这样既保留了它的发挥空间,也避免一开始就跑偏。开放需求不等于无约束,提前给定一些不可碰的边界(比如技术栈、分层规范)能显著稳定输出质量。
|
12
foryou2023 7h 27m ago
需求描述清楚,让 ai 给解决方案,符合自己需求的方案,然后再细化,需求细节讨论的差不多了,然后写文档,再让 ai 干活。
现实跟产品沟通不也是这样的么,沟通清楚需求,然后自己出解决方案,然后实现。 现在只不过变成了指挥 ai 干活而已。 |
13
foryou2023 7h 24m ago
@foryou2023 认知上把 ai 当成一个啥都会干的人,正常沟通,这样操作,个人实践过程中感觉挺好的。
|
14
skuuhui OP @someonelikeyouah 我期望不是由开发来主导,但目前是开发来担责,谁也不愿意担责。
|
15
huoru 6h 26m ago
你们还 review AI 写的代码吗?
|
16
skuuhui OP @teaguexiao
@foryou2023 你们的方案是所有能看到的技术贴都提到的并且也最为大家熟知的。但我是无论是严格执行还是局部优化结果都差强人意,至少去年 9 月我就是实践过这一套了。所以我好奇,说这些理论的人是缺乏实践随口一说停留的想象层面,还是自己有一套自己专属的驾驭方式只是没有表达清楚。 另外:其实你定义了约束就是限制了开放性,如果指令遵循的好,他永远设计不出超出你边界外更合理的设计。这本质上来说和你教他怎么做一样。无法就是一个是我告诉他要做什么,一个是我告诉他不能做什么。 |
17
Cabana 2h 26m ago
所以再等等下个世代的基础模型吧, 就不会有这么多需要在工程上去处理基础模型的能力边界问题了。目前的话就只能修修补补咯~
|
18
paranoiagu 2h 10m ago
你是产品经理,AI 是原来你的手下小伙伴。
你觉得该怎么用这些小伙伴就怎么样用。AI 比小伙伴更加肯干,知识更加全面,没有怨言……………… |