V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
xingfu0539
V2EX  ›  Google

为什么我的 gemini 2.0 一点也不智能

  •  
  •   xingfu0539 · 18 天前 · 3460 次点击

    同时开了 chatgpt plus 和 google AI One Premium ,chatgpt 在同一个 chat 中,能否很好地结合上下文,gemini 2.0 几乎只会关注我的最后一个问题。每次提醒之后,仍然没有改善。

    但看见 reddit 上铺天盖地都是赞扬 gemini 的,是遇到我这种情况的人很少吗?还是说我的 prompt 不行。

    第 1 条附言  ·  10 天前
    经过一段时间的试用,主要是 1206 模型,最起码我现在的结论是——在回答问题的上下文关联上,gemini 落后 chatgpt 很多。
    我询问 intel CEO 被裁,相同的提问顺序,中间有一句,现在是 2025 年 1 月 7 日,结果 chatgpt 很明显能跟 CEO 的问题结合起来,而 gemini 直接回答我“好的,我有什么能够帮你”“你对下面这些事情感兴趣吗”之类的欢迎语。
    不过 AI One 我还是不打算退掉,在经济允许的情况下,我会尽可能试用更多的 AI 大模型,因为从我的认知上理解,没有完美的大模型,也希望 google 能赶上来,不要一家独大。
    39 条回复    2025-01-03 23:20:26 +08:00
    CNN
        1
    CNN  
       18 天前   ❤️ 1
    确实,虽然 Gemini 的翻译准确性完爆其他,但经常无法翻译,拉胯
    crackidz
        2
    crackidz  
       18 天前
    可能因为是大家用的 aistudio ?
    love060701
        3
    love060701  
       18 天前   ❤️ 1
    因为 Gemini 2 还没有到 Gemini APP 里,需要在 AI Studio 里用,而且完全免费。
    xingfu0539
        4
    xingfu0539  
    OP
       18 天前
    @crackidz 我用的是 https://gemini.google.com/app 网页,里面的 2.0 experimental advanced ,2.0 Flash Experimental ,这个跟 AI Studio 里的有区别吗?
    xingfu0539
        5
    xingfu0539  
    OP
       18 天前
    @love060701 我看 APP 里有 2.0 Flash Experimental 了
    xingfu0539
        6
    xingfu0539  
    OP
       18 天前
    @CNN 翻译我是没用过,但同一个 chat ,大部分情况下是真的不考虑上下文 context ,直接给出答案,我得不停地在 prompt 里强调,修正它的回答,非常累。可能是因为我问的是技术问题?但看 reddit 上各种说完爆 gpt4o 的,我就怀疑是不是自己姿势不对。
    beneo
        7
    beneo  
       18 天前
    settings -> saved info 里面加入 prompt 才能更智能
    jdz
        8
    jdz  
       18 天前 via Android
    你不是一个人
    xingfu0539
        9
    xingfu0539  
    OP
       18 天前
    @beneo 看了下介绍,我先尝试预设一些 prompt ,虽然我总觉得这个跟我上面的关系不是很大。
    xingfu0539
        10
    xingfu0539  
    OP
       18 天前
    @jdz 就我目前短暂的使用体验来说,回答问题不结合上下文的话,感觉几乎就是毫无用处,但看大家用的这么 happy ,真是小心翼翼求证
    Jakarta
        11
    Jakarta  
       18 天前
    我个人体验,1.5 或者 2.0 ,不只是不能结合上下文,单条回答的质量也比不上 4o
    wangtong868
        12
    wangtong868  
       18 天前
    要用 ai studio experiment 1206. flash 2.0 确实会这样。
    neteroster
        13
    neteroster  
       18 天前 via Android   ❤️ 1
    建议用 AI Studio ,谷歌 C 端那个产品非常垃圾,加了一堆奇怪提示词,模型效果降的很严重。我觉得 1206 在大部分情况下能打碎 4o 是很显然的,我现在都不觉得这两是一个级别的东西了。
    mumbler
        14
    mumbler  
       18 天前
    Rust2015
        15
    Rust2015  
       18 天前
    reddit 红迪被 Google 7500 万刀一年给收买了,做喂料了
    dobelee
        17
    dobelee  
       18 天前
    不用怀疑,C 端确实是智障,实在理解不了谷歌怎么想的,直接给 GPT 、grok 送人头。
    nightwitch
        18
    nightwitch  
       18 天前
    质量上 1206 > exp thinking 1219 > flash 2.0 。

    flash 2.0 就是纯快,适合简单的任务 + 快速反应,比如查点 shell 命令该怎么写这种,flash 就足够了。
    thinking 属于居中的,上下文比较小(32k),但是聪明很多
    1206 质量最好,但是是 pro 级别的大模型,适合处理复杂任务,但是 token 吐的太慢了
    LYerma
        19
    LYerma  
       18 天前 via Android
    只用 claude
    GrayXu
        20
    GrayXu  
       18 天前
    @xingfu0539 #5 那就破案了,flash 是小的模型,不过翻译还是好用的。正经还是得 exp 1206
    SenLief
        21
    SenLief  
       18 天前
    还可以吧,我最近总 2.0 写了一个简单的注册 bot ,它联系上下文的能力还可以。
    lovestudykid
        22
    lovestudykid  
       18 天前
    我感觉谷歌还有其他厂商都是预训练大力出奇迹,但是对齐上目前只有 openai 和 anthropic(oai 原班人马)掌握机密。体现在使用上就是感觉模型很聪明,刷分也很高,但就是不好用。
    KimiArthur
        23
    KimiArthur  
       18 天前 via Android
    @CNN 安全第一没办法……
    ggmood
        24
    ggmood  
       17 天前 via iPhone
    我问了一句 2025 年天文事件,它回复“尽管还有几年,但我们可以预见……”
    ai studio 这是扒了哪年的数据?
    walkbox
        25
    walkbox  
       17 天前   ❤️ 1
    对比微软的和这个 gemini ,我选 gemeini , 微软已经被国内风气侵蚀了吧,搞个 bing 主页上面一堆今日头条款,类似隔壁老母鸡下蛋了这种的都能上新闻的咋咋呼呼的垃圾资讯,
    Zenon
        26
    Zenon  
       17 天前
    gemeini 经常无法理解上下文,体验刁差
    JackLee23
        27
    JackLee23  
       17 天前   ❤️ 1
    怀疑和大家用的不是一个 gemini ,chatgpt 降智严重,不降智的时候还行,gemini 至少胜在稳定;我用 gemini 的时候,大部分时候上下文联系还是可以的,偶尔联系能力不好的时候,我直接开始新对话
    guoziq09
        28
    guoziq09  
       17 天前
    @walkbox 别人说城门楼子,你搁这说胯骨轴子...大家讨论的都是哪家 AI 好用,你搁这整上 bing 了.
    courtier
        29
    courtier  
       17 天前
    话说你们怎么用 gemini 的...我谷歌账号是港区的有什么办法能体验上吗
    walkbox
        30
    walkbox  
       17 天前
    @guoziq09 不好意思 跑题了
    walkbox
        31
    walkbox  
       17 天前   ❤️ 1
    @guoziq09 我对比的是 copilot 和 gemini 的使用体验, 不小心跑到吐槽 bing 搜索上了
    xingfu0539
        32
    xingfu0539  
    OP
       17 天前
    谢谢大家的回复,先不一一回复了,等今天尝试 1206 模型,有更新的体验再分享出来。
    xingfu0539
        33
    xingfu0539  
    OP
       17 天前
    @courtier 港区比较难,建议还是换区或者重新申请一个美区账号。
    xingfu0539
        34
    xingfu0539  
    OP
       17 天前
    @GrayXu 好的,我今天试一下
    xingfu0539
        35
    xingfu0539  
    OP
       17 天前
    @Jakarta 说实话,我也有同感,感觉像是 N 年前的产品,但 google 应该不至于这么拉跨,所以可能这套 C 端产品暂时还不是很重视吧
    Ariake265
        36
    Ariake265  
       17 天前
    Gemini 的 APP 的自作主张加 Prompt 也不是一天两天了,最初那些历史人物大面积“染黑”也是这种 Prompt 惹的祸。自己调用 API 或者用 AI Studio 会好用的多
    idragonet
        37
    idragonet  
       17 天前
    @courtier #29 美国梯子....
    wolfie
        38
    wolfie  
       14 天前
    gemini 垃圾的要死,根本听不懂指令。
    gpt5
        39
    gpt5  
       14 天前
    我看有人说是因为政治正确和审查,加了太多限制导致的?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   948 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 20:27 · PVG 04:27 · LAX 12:27 · JFK 15:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.