为什么我的 gemini 2.0 一点也不智能

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

› Google Play

› Google Fi

› Google Developers Channel

› Google 全球透明度报告

› 9to5Google

这是一个创建于 278 天前的主题，其中的信息可能已经有所发展或是发生改变。

同时开了 chatgpt plus 和 google AI One Premium ，chatgpt 在同一个 chat 中，能否很好地结合上下文，gemini 2.0 几乎只会关注我的最后一个问题。每次提醒之后，仍然没有改善。

但看见 reddit 上铺天盖地都是赞扬 gemini 的，是遇到我这种情况的人很少吗？还是说我的 prompt 不行。

第 1 条附言 · 270 天前

经过一段时间的试用，主要是 1206 模型，最起码我现在的结论是——在回答问题的上下文关联上，gemini 落后 chatgpt 很多。
我询问 intel CEO 被裁，相同的提问顺序，中间有一句，现在是 2025 年 1 月 7 日，结果 chatgpt 很明显能跟 CEO 的问题结合起来，而 gemini 直接回答我“好的，我有什么能够帮你”“你对下面这些事情感兴趣吗”之类的欢迎语。
不过 AI One 我还是不打算退掉，在经济允许的情况下，我会尽可能试用更多的 AI 大模型，因为从我的认知上理解，没有完美的大模型，也希望 google 能赶上来，不要一家独大。

39 条回复 • 2025-01-03 23:20:26 +08:00

CNN

278 天前

确实，虽然 Gemini 的翻译准确性完爆其他，但经常无法翻译，拉胯

crackidz

278 天前

可能因为是大家用的 aistudio ？

love060701

278 天前

因为 Gemini 2 还没有到 Gemini APP 里，需要在 AI Studio 里用，而且完全免费。

xingfu0539

278 天前

@crackidz 我用的是 https://gemini.google.com/app 网页，里面的 2.0 experimental advanced ，2.0 Flash Experimental ，这个跟 AI Studio 里的有区别吗？

xingfu0539

278 天前

@love060701 我看 APP 里有 2.0 Flash Experimental 了

xingfu0539

278 天前

@CNN 翻译我是没用过，但同一个 chat ，大部分情况下是真的不考虑上下文 context ，直接给出答案，我得不停地在 prompt 里强调，修正它的回答，非常累。可能是因为我问的是技术问题？但看 reddit 上各种说完爆 gpt4o 的，我就怀疑是不是自己姿势不对。

beneo

278 天前

settings -> saved info 里面加入 prompt 才能更智能

jdz

278 天前 via Android

你不是一个人

xingfu0539

278 天前

@beneo 看了下介绍，我先尝试预设一些 prompt ，虽然我总觉得这个跟我上面的关系不是很大。

xingfu0539

278 天前

@jdz 就我目前短暂的使用体验来说，回答问题不结合上下文的话，感觉几乎就是毫无用处，但看大家用的这么 happy ，真是小心翼翼求证

Jakarta

278 天前

我个人体验，1.5 或者 2.0 ，不只是不能结合上下文，单条回答的质量也比不上 4o

wangtong868

278 天前

要用 ai studio experiment 1206. flash 2.0 确实会这样。

neteroster

278 天前 via Android

建议用 AI Studio ，谷歌 C 端那个产品非常垃圾，加了一堆奇怪提示词，模型效果降的很严重。我觉得 1206 在大部分情况下能打碎 4o 是很显然的，我现在都不觉得这两是一个级别的东西了。

mumbler

278 天前

aistudio.google.com

Rust2015

278 天前

reddit 红迪被 Google 7500 万刀一年给收买了，做喂料了

Rust2015

278 天前

https://www.thepaper.cn/newsDetail_forward_26491697

dobelee

278 天前

不用怀疑，C 端确实是智障，实在理解不了谷歌怎么想的，直接给 GPT 、grok 送人头。

nightwitch

278 天前

质量上 1206 > exp thinking 1219 > flash 2.0 。

flash 2.0 就是纯快，适合简单的任务 + 快速反应，比如查点 shell 命令该怎么写这种，flash 就足够了。
thinking 属于居中的，上下文比较小(32k)，但是聪明很多
1206 质量最好，但是是 pro 级别的大模型，适合处理复杂任务，但是 token 吐的太慢了