V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
skuuhui
V2EX  ›  程序员

在 AI coding 上的困境,想做个调研

  •  
  •   skuuhui · 8h 20m ago · 1482 views

    先说问题,不绕。。。。你们觉得目前你最常用的模型,在开放需求下它的功能、架构设计你能给它定多少年工作经验的程序员(或阿里 P 几水平)。

    模型:gpt5.5 中(大部分功能设计,因为便宜),Claude Opus 4.6 我的困境:

    1. 如果我的需求过于开放,在 plan 的时候,架构功能设计质量非常不稳定,大多数时候在我擅长领域我认为只能达到 4 年的程序员水准。
    2. 如果我给的过于严格的边界和约束,那么会变成 AI 的上限就是我的上限,又太过于突出个人能力或者弱化了 AI 的能力。
    3. 如果我给的过于严格的边界和约束并且总是坚持我的想法,那就变成了我在教 AI 做事,这里大量的成本在我和 ai 的沟通,并且需要它完全明白我的意思。

    当然,上面的所有前提都是一个生产项目和程序员职业。自己 coding 玩具项目或者非程序员岗位不算

    18 replies    2026-05-08 17:27:52 +08:00
    sentinelK
        1
    sentinelK  
       8h 6m ago
    1 、我会干预其架构设计。不是别的,是因为我要为我的 Agent 兜底,他的技术选型我看不懂我就兜不了……
    2 、看心情,所以我目前在尝试可能的情况下,让 hermes 接管我的代码仓库和文档,让他帮我去调用 claudeCode/openCode 。我只提需求和把控设计。
    3 、同理,hermes 可以大幅度降低人工提供上下文的心智负担。
    someonelikeyouah
        2
    someonelikeyouah  
       8h 4m ago
    偏个题,评估这个意义在哪里? 你自己知道上限 下限 能做到哪里就行了,评级是为了给公司指出开发的预算么?
    sentinelK
        3
    sentinelK  
       8h 1m ago
    btw:使用大模型,核心矛盾点,就是你需要投入多少精力来进行控制。这和企业管理的底层逻辑相通。

    你给员工更大的自由,他就更能发挥上限,代价就是捅娄子的能力也更强。
    你越依赖微操,你的员工的能力就越难以发挥,也就越难以突出你的人力优势。这里要 @蒋委员长
    lmmlwen
        4
    lmmlwen  
       8h 0m ago
    一个小小的程序员如此大放厥词,ai 编码是无上限的,只是你和你们的项目代码过于平庸,它只是选择了一个最为中庸的结果给你。
    lmmlwen
        5
    lmmlwen  
       7h 59m ago
    阿里 p8 的 py 代码,还得我来修改一轮低级 bug ,这没有任何意义
    skuuhui
        6
    skuuhui  
    OP
       7h 57m ago
    @sentinelK 我会尝试一下你的方式。但有时候我会总会觉得,流程越复杂,ai 调用层级越多,出错的概率越大 0.99*n
    skuuhui
        7
    skuuhui  
    OP
       7h 56m ago
    @someonelikeyouah 人类可能是以后公司内唯一需要承担责任的少部分实体。如果一个功能 AI 跑了 2 天,上限直接奔溃了,老板可不会追责 AI
    skuuhui
        8
    skuuhui  
    OP
       7h 52m ago
    @lmmlwen bug 还只是最简单的错误了。如果一开始实现上就存在隐患,如果后期产生问题,影响范围和修复成本都很高
    sentinelK
        9
    sentinelK  
       7h 50m ago
    @skuuhui 这个直觉没错的,但是对应的账应该反过来算。
    1 、你降低了你自己的心智负担,你就更有时间、精力来给模型兜底。
    2 、目前主流的 Agent 思路是 loop + 审核抽卡,所以误差的积累很大程度上可以靠增多多抽卡次数来抹平。也就是靠烧更多的 token 来换你更少的干预。
    3 、目前模型的能力更强了,最优解的统计学优势更明显,即便上下文有一系列错误,也会无视或者自行纠错。
    someonelikeyouah
        10
    someonelikeyouah  
       7h 50m ago
    @skuuhui #7 可行性分析现在是开发来主导了么?
    teaguexiao
        11
    teaguexiao  
       7h 36m ago
    我的做法是先让 AI 出两三个方案,我挑一个架构方向再让它深入,这样既保留了它的发挥空间,也避免一开始就跑偏。开放需求不等于无约束,提前给定一些不可碰的边界(比如技术栈、分层规范)能显著稳定输出质量。
    foryou2023
        12
    foryou2023  
       7h 27m ago
    需求描述清楚,让 ai 给解决方案,符合自己需求的方案,然后再细化,需求细节讨论的差不多了,然后写文档,再让 ai 干活。

    现实跟产品沟通不也是这样的么,沟通清楚需求,然后自己出解决方案,然后实现。

    现在只不过变成了指挥 ai 干活而已。
    foryou2023
        13
    foryou2023  
       7h 24m ago
    @foryou2023 认知上把 ai 当成一个啥都会干的人,正常沟通,这样操作,个人实践过程中感觉挺好的。
    skuuhui
        14
    skuuhui  
    OP
       7h 11m ago
    @someonelikeyouah 我期望不是由开发来主导,但目前是开发来担责,谁也不愿意担责。
    huoru
        15
    huoru  
       6h 26m ago
    你们还 review AI 写的代码吗?
    skuuhui
        16
    skuuhui  
    OP
       6h 19m ago
    @teaguexiao
    @foryou2023
    你们的方案是所有能看到的技术贴都提到的并且也最为大家熟知的。但我是无论是严格执行还是局部优化结果都差强人意,至少去年 9 月我就是实践过这一套了。所以我好奇,说这些理论的人是缺乏实践随口一说停留的想象层面,还是自己有一套自己专属的驾驭方式只是没有表达清楚。
    另外:其实你定义了约束就是限制了开放性,如果指令遵循的好,他永远设计不出超出你边界外更合理的设计。这本质上来说和你教他怎么做一样。无法就是一个是我告诉他要做什么,一个是我告诉他不能做什么。
    Cabana
        17
    Cabana  
       2h 26m ago
    所以再等等下个世代的基础模型吧, 就不会有这么多需要在工程上去处理基础模型的能力边界问题了。目前的话就只能修修补补咯~
    paranoiagu
        18
    paranoiagu  
       2h 10m ago
    你是产品经理,AI 是原来你的手下小伙伴。

    你觉得该怎么用这些小伙伴就怎么样用。AI 比小伙伴更加肯干,知识更加全面,没有怨言………………
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3476 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 11:37 · PVG 19:37 · LAX 04:37 · JFK 07:37
    ♥ Do have faith in what you're doing.