V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
xuelang
V2EX  ›  OpenAI

chatgpt 为啥能做出不少算法题?

  •  
  •   xuelang ·
    selfboot · 325 天前 · 1680 次点击
    这是一个创建于 325 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有一道 easy 的 leetcode 题目,gpt 很容易就给出了不错的解决代码,还有完整的思考过程,有点人的感觉了。详细过程在这里.

    这两天也在试一些 leetcode 上面比较新的 medium 和 hard 题目,gpt 给的方法还是很惊艳的,所以 gpt 的逻辑推理能力真的是一种 “涌现” 出来的能力吗。

    第 1 条附言  ·  325 天前
    后面又试了一个新的题目,https://leetcode.com/problems/sum-of-matrix-after-queries/
    GPT4 在提示后,也给出了 accept 代码,
    对话在这里 https://chat.openai.com/share/94bcadbe-88b1-4bcd-b907-a1eaec703fc7
    9 条回复    2023-06-07 13:35:22 +08:00
    Tink
        1
    Tink  
       325 天前
    生成式模型就是想出来的啊
    centralpark
        2
    centralpark  
       325 天前
    leetcode 的题都在训练数据里,看这个没意思
    hubqin
        3
    hubqin  
       325 天前 via Android
    生成式 AI, 每个字都是根据前面的字推断出来的。为什么这么通顺,像真的有智能一样,因为他有几千亿个参数。
    sentinelK
        4
    sentinelK  
       325 天前 via iPhone
    他不是逻辑推理,他是根据上文猜测下一个最可能的字。相当于是一种非常暴力的统计学+训练调优结果。

    从某种意义上讲,大语言模型证明了人类的创意性产出(设计,撰写)其实很大程度上就是复读机(有强相关性),只不过人类大脑的并行能力有限,发现不了,或者发现了但很难抽象成一个方法论而已。
    RandyLuo
        5
    RandyLuo  
       325 天前
    因为在数据集里面,之前 Hacker News 讨论过,让 ChatGPT 做 Codeforces Div.3 的题,发现旧的题全对,新出的题几乎全错。
    locoz
        6
    locoz  
       325 天前 via Android
    无论是思考过程还是可运行的代码,训练数据里都有,做出来很正常。

    要看逻辑推理能力,应该让 AI 做一些需要一定逻辑和分析能力,且训练数据中必然无法直接涉及到的事,比如:把一个 yaml 转换成 json ,并且必须符合你制定的规范,同时 yaml 中可能还有特殊的 value 也需要按规范进行处理。

    像这种要求,绝大多数开源的所谓达到 ChatGPT 多少多少能力的模型,都会出问题。
    xuelang
        7
    xuelang  
    OP
       325 天前
    @centralpark 其实找了一个新的题目,https://leetcode.com/problems/sum-of-matrix-after-queries/description/ ,能暴力算出来。提示后也能给出优化解决方案。
    xuelang
        8
    xuelang  
    OP
       325 天前
    @sentinelK 是的,我比较同意,就是暴力随机+调优。 不过目前能力,也比很多普通人强了,medium 的新的题目,提示后很快就能做对。
    xuelang
        9
    xuelang  
    OP
       325 天前
    @locoz 我试了比较新的题目,gpt4 在简单提示 2 次后,也给出了一个优化后的实现。对话在这里 https://chat.openai.com/share/94bcadbe-88b1-4bcd-b907-a1eaec703fc7
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   942 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 42ms · UTC 19:41 · PVG 03:41 · LAX 12:41 · JFK 15:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.