V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
nealHuang
V2EX  ›  程序员

Gemini 2.5 pro 在这个问题上栽跟斗

  •  
  •   nealHuang · 14 天前 · 5174 次点击
    因为最近发现了一个 bug 代码示例如下

    public static void main(String[] args) {
    double num = 0.0;
    double min = Double.MIN_VALUE;
    System.out.println(num < min);
    }



    然后我就去问 Gemini ,这段代码输出的结果是什么,结果在这种简单问题上都是答错的,紧接着去测试了一下 ChatGPT 和 DeepSeek ,都能正确分析给出 True 的结果

    第 1 条附言  ·  14 天前
    虽然这个帖子是在讨论 Gemini 的问题,但实际上弱弱的想问一句,是不是只有我一直误以为 Double.MIN_VALUE 是负数 shit T_T
    30 条回复    2025-09-04 15:25:11 +08:00
    surbomfla
        1
    surbomfla  
       14 天前
    写代码 不要使用 Gemini ,pom.xml 文件开头 <?xml ,gemini cli 生成了 <xml ,测试其他 ds claude glm4.5 模型没出过这样的低级问题
    liulicaixiao
        2
    liulicaixiao  
       14 天前
    claude 也错了
    ma46
        3
    ma46  
       14 天前
    推理过程正确,结果错误
    omega3
        4
    omega3  
       14 天前
    我的 gemini 两次都回答 true ,你可能遇到降智了
    xomix
        5
    xomix  
       14 天前
    AI 本质上是内容生成,现在就算是看起来再有逻辑,它也不会直接通过逻辑判断,所以这种测试在当下没有什么必要。对于训练者无非是针对这些东西做一些内容训练。
    thinkever
        6
    thinkever  
       14 天前
    gemini 代码能力确实欠缺一些,建议 claude 或 deepseek-r1
    2en
        7
    2en  
       14 天前
    htfcuddles
        8
    htfcuddles  
       14 天前
    我用 API 测试者正确的,有没有可能你 IP 太脏被降智了?
    Curtion
        9
    Curtion  
       14 天前
    Sonnet 4 还会自我纠正
    suxiaoxiann
        10
    suxiaoxiann  
       14 天前
    为什么我的也是 true 。
    bbao
        11
    bbao  
       14 天前
    Gemini 我不信任他,刚开始我用一个开源项目进行测试,分析,只有它的输出驴唇不对马嘴,就在那编; chatgpt 都是没问题的。
    Jasonqiao
        12
    Jasonqiao  
       14 天前
    我也感觉大概率是被降智,最近我的 gemini 也频繁遇到这样的问题,对话中我使用一些完全不生僻的简写或名词,它能直接开始臆想瞎编,哪怕调用一下搜索也不至于生成完全驴唇不对马嘴的答案。我这用的 IP 纯净度应该还好啊,有重置或修复的办法么?
    livin2
        13
    livin2  
       14 天前
    降智这种成本控制操作确实难顶,哪怕直接严风控封 IP 呢
    street000
        14
    street000  
       14 天前 via Android
    感觉 App 的 Gemini 是被降智了,AI Studio 里的 Flash Lite 都能答对。
    qxmqh
        15
    qxmqh  
       14 天前
    Gemini 只会道歉和一个劲的客气,跟 tm 日本人似的。很傻瓜。
    snow0
        16
    snow0  
       14 天前
    网页版 Gemini 和 AI Studio 都回答 false ,一纠正马上就抱歉了
    nealHuang
        17
    nealHuang  
    OP
       14 天前
    @liulicaixiao 强如 Claude 也降智
    nealHuang
        18
    nealHuang  
    OP
       14 天前
    @htfcuddles 有可能哈,不过我是 gemini 的年度 pro 教育白嫖版,居然都降智!真是大胆
    eroneko
        19
    eroneko  
       14 天前
    2.5 Pro 降智很严重,怀念 03-25
    pweng286
        20
    pweng286  
       14 天前
    2.5-flash,纠正了两次
    westfall
        21
    westfall  
       14 天前
    今天薅了个 Gemini 教育版,免费 12 个月,第一次对话就给我干懵了,它居然倾向于欺骗我。它声称自己能听懂音频,我上传了个外企工作相关的访谈节目让它总结一下,它给我瞎编一通。
    https://g.co/gemini/share/46062a841a23
    kekxv
        22
    kekxv  
       14 天前 via iPhone
    gemini-cli 的 2.5 Pro 贼强
    yulon
        23
    yulon  
       14 天前
    可能数据有污染,Qwen 正确,GLM 居然错了,而且它自己都说 0 小于正数了,结果却是 false 。
    rrfeng
        24
    rrfeng  
       14 天前
    Gemini flash 回答正确
    Kairossaster
        25
    Kairossaster  
       14 天前 via Android
    gemini2.5pro 和 chatgpt 输出 true 。claude sonnet4.1 和 grok3 false
    charles0
        26
    charles0  
       14 天前
    三个不同渠道的 gemini-2.5-pro 都给了 true 的正确答案,你肯定遇到降智了
    yulon
        27
    yulon  
       14 天前
    我好像知道某些 AI 的逻辑了:

    因为二进制的存储方式,把「正数」和「无符号数/非负数」划等号了,0 被 AI 当成了「正数」,此时 0 自己就是「最小的正数」,当然不能小于「最小的正数」。

    并且在某些推理过程中,虽然能得出 Double.MIN_VALUE 是「大于 0 的正数」,但是在后续推理中,可能出于节省 token ,变成了「正数」,而「正数」又被误解为「全体正数」,被当成「正数」的 0 ,自然也不能小于「全体正数」。
    cat1879
        28
    cat1879  
       13 天前
    gemini 2.5pro False
    PPLX ture
    claude false
    since2021
        29
    since2021  
       13 天前
    我第二次开了 deep thought 回答对了,第一次不对
    zpxshl
        30
    zpxshl  
       13 天前
    gemini2.5 输出 true ,我是用 poe 中转的 e
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2533 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 15:24 · PVG 23:24 · LAX 08:24 · JFK 11:24
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.