V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dtla
V2EX  ›  程序员

一道 Java 八股,检测 AI 智商

  •  
  •   dtla · 74 天前 · 10277 次点击
    这是一个创建于 74 天前的主题,其中的信息可能已经有所发展或是发生改变。
    You should give me the interview answer directly, without explaining anything unless necessary. Your answers are expected to be directly used for a Java interview. Please be concise, but your answers should perfectly satisfy the interviewer.
    
    The question is: How do you deal with the error?
    

    这个八股的内在逻辑在于,error 不等于 exception ,问的是遇到 error 该怎么办,而不是 exception handle 。

    经过多次测试

    只要一上来就回答 try-catch 或者 exception handle 的,都是智商不行的。google 家的所有 AI 全部垃圾copilot Pro 也垃圾。不能通过测试

    官网的 GPT 4 可以过,gpt4-1124 模型回答的最好,claude.AI 回答的可以接受。

    官网 GPT 4:

    1124 模型:

    Google gemini ultra:

    第 1 条附言  ·  74 天前
    中文论坛素质真的低。发帖发一下自己的发现,先是被质疑语法,然后质疑问题问的傻,相关的回复少之又少。

    以后直接 reddit 讨论了,中文社区真的惹不起
    第 2 条附言  ·  74 天前
    题源参见 Grokking The Java Developer Interview:

    Question 15: Difference between error and exception

    Answer: Error: Errors in a program are irrecoverable, they indicate that something severe has gone wrong in the application and the program gets terminated in case of error occurrence e.g. running out of memory: OutOfMemoryError, making too many recursive calls: StackOverflowError etc.

    没有必要质疑题是哪来的( from paypal),这是一道经典面试题,这道题只是把 exception 比较删除了,让你单独说 error (非 exception )如何 handle
    第 3 条附言  ·  74 天前
    From Grokking The Java Developer Interview

    Question 15: Difference between error and exception

    Answer: Error: Errors in a program are irrecoverable, they indicate that something severe has gone wrong in the application and the program gets terminated in case of error occurrence e.g. running out of memory: OutOfMemoryError, making too many recursive calls: StackOverflowError etc.

    Exception: Exceptions on the other hand are something that we can recover from by handling them properly e.g.: trying to access a property/method from a null object: NullPointerException, dividing an integer by zero: ArithmeticException etc.
    第 4 条附言  ·  74 天前

    附加问题,should I use try-catch, 0125模型完美回答

    第 5 条附言  ·  73 天前

    0125模型完美的答案,对比其他模型,全部fail,那些说这道题没意义的人,你们的脸被打的疼吗?

    前排几位歪楼的回复,彻底彰显了中文论坛的低素质,感谢后面一起讨论的楼层朋友的回复。

    146 条回复    2024-02-29 12:08:16 +08:00
    1  2  
    silencil
        101
    silencil  
       73 天前
    @wallriding 你是真挺能杠的,不知道你平时复制粘贴有没有那么细心。这么爱挑人错误的人,在生活中有交好的朋友和同事吗?
    dtla
        102
    dtla  
    OP
       73 天前
    @nothingistrue

    八股答案都贴出来了,看不懂英文吗?面试期盼的答案就是不做 try-catch ,本来不想喷你,一上来就说秀智商,我看你才是秀智商下限吧?

    In Java, it's generally recommended not to use try-catch blocks to handle Errors. Errors are
    used to indicate serious problems that applications should not attempt to catch, as they are
    often related to issues with the Java Virtual Machine or the hardware. Instead, focus should be
    on resolving the underlying problems causing these errors.
    LUO12826
        103
    LUO12826  
       73 天前
    虽然但是,看了下 OP 在其它帖子的回复,没绷住
    dtla
        104
    dtla  
    OP
       73 天前
    @nothingistrue

    我本来都不想回这个帖子了,真的看见你这个回复我真的怒了。上来就说别人智商不行?这道八股有正确答案的题,你在秀你智商下限吗?

    对比 gemini 的回复,一上来就 try-catch ,在 senior 面试上已经挂了。

    From Google:
    "An Error is a subclass of Throwable that indicates serious problems that a reasonable application should not try to catch. Most such errors are abnormal conditions. The ThreadDeath error, though a "normal" condition, is also a subclass of Error because most applications should not try to catch it."

    另外,如果你不会用搜索引擎,只会叫嚣,我建议你在叫嚣之前看完楼层回复,一上来就人生攻击,只会显得你素质低下。
    dtla
        105
    dtla  
    OP
       73 天前   ❤️ 1
    @LUO12826 又一个中文社区的败类出现了,不对帖子本身内容进行评论,先上来对发帖者进行评价或者攻击一番。nice
    kneo
        106
    kneo  
       73 天前 via Android
    @CyrilYu #89 朋友,给个原文啊。你引用的这段话连 java 都是小写,让我觉得出处相当业余,我不认为能代表什么。

    我不是说咱们平常随便谈论问题要得把 java 大写,但 Google 出来的东西得分辨一下。随便 Google 了个不知何许人随手打的字,拿来当论据,还给大家下了个“没一个人说到点子上”的地图炮,除了你自己觉得帅之外恐怕没人站你。
    null123456
        107
    null123456  
       73 天前   ❤️ 1
    恕我直言,v2ex 里很多人都是傻 x
    kneo
        108
    kneo  
       73 天前 via Android
    @silencil #101 “这么爱挑人错误的人,在生活中有交好的朋友和同事吗?”——这么说这就过分了,与人身攻击无异。
    nothingistrue
        109
    nothingistrue  
       73 天前
    看完之后,好嘛,原来跟 Java 就没关系,是个英语文字游戏(然后楼主还偏偏不允许别人质疑语法)。这更恶劣了:相当拿中文藏头诗去考刚开始学中文的外国人,借此说外国人笨;相当于拿微积分去考小学生,借此说小学生笨;相当于拿手工作业去考猫,借此说猫笨。
    dtla
        110
    dtla  
    OP
       73 天前
    @nothingistrue 你哪句话看到我不准质疑语法了?我在后面的楼层回复的很明白吧,你们问我语法,我不懂,这不是我出的题,你去问出题的人。但这个语法跟本帖讨论的内容有一毛钱关系吗? gpt 4 1125 回答的答案,其余几个模型都回答不出来,这还看不出模型之间的差距吗?

    我真的不懂,你们这么喜欢讨论语法的????? LLM 模型直接无视这种语法好吗
    nothingistrue
        111
    nothingistrue  
       73 天前
    楼主:只要一上来就回答 try-catch 或者 exception handle 的,都是智商不行的。

    别人:智商不行就不要秀。

    楼主:上来就说别人智商不行?

    —— 看来已经没有必要再继续讨论了。
    dtla
        112
    dtla  
    OP
       73 天前
    @nothingistrue 你是看不懂“只要一上来就回答 try-catch 或者 exception handle 的,都是智商不行的”这句话是对 AI 的形容吗?

    100 多层楼了,还有来歪楼讨论语法,觉得自己是正义使者,真的中文社区没救了。
    dtla
        113
    dtla  
    OP
       73 天前
    @nothingistrue 请问你有看这个贴讨论的是什么吗?讨论的是 AI 的回复,你要是阅读理解有问题,你确实没有必要回复。

    100 多层楼,有几个真正讨论帖子的主题?明显这个问题可以看出模型之间的优劣,却全在说英语语法?

    中文社区没救了
    Alias4ck
        114
    Alias4ck  
       73 天前   ❤️ 2
    昨天我看我还在讨论问题,后面看笑了,竟然讨论到语法上,为啥 v 站讨论问题总能走偏,这不是技术论坛吗?为啥讨论着就会有人莫名的跟风开始攻击别人,麻烦对事不对人好吗?
    另外楼主说的没毛病啊 gpt-4 确实吊打现在大部分模型啊,这点毋庸置疑啊
    wallriding
        115
    wallriding  
       73 天前
    @silencil #101

    > 不知道你平时复制粘贴有没有那么细心
    有的

    > 在生活中有交好的朋友和同事吗?
    没有。我居然会正确使用定冠词并且指出别人的错误,显然我肯定是没有朋友的。
    janus77
        116
    janus77  
       73 天前
    另一个角度:有没有可能 大家纠结语法是因为你如果对人说话,语法错了问题不大,但是你如果对 AI 说话,语法错了问题挺大的?
    当然我也同意你说的语法问题不大的观点,但是我想强调的还是,对 AI 说话,学会提问是最核心的,甚至是影响 AI 最终结果的一个根本点。。。
    dtla
        117
    dtla  
    OP
       73 天前
    @janus77

    第一,语法本身没有问题,前排指正语法错误的,已经被后面楼层指出,这句话本身就没有语法问题。

    第二,AI 无视语法问题。

    第三,退一万步,就算这句话语法错的离谱,不同的 AI 给出了不同的答案,1125 模型能给出一个完美的答案来看,1125 模型要比其他模型优秀。这才是本帖讨论的重点


    请不要讨论语法了,语法本身没有错误,也和本帖丝毫没有关系。
    dtla
        118
    dtla  
    OP
       73 天前
    @wallriding 我觉得你真的很能杠,纵观你对本帖的发言,对本帖关注的主要内容一句都没讨论,讨论的重点就是语法语法语法,然而语法本身是没有问题的。我不知道为什么你还要回复这么多,还能杠这么久。

    我语法是不好,不然也不会看不出:这句英语实际没有语法错误,整个帖子被你胡搅蛮缠这么久,你也是挺厉害的。
    dtla
        119
    dtla  
    OP
       73 天前
    我不想回复其他内容了,对 V2EX 很失望,这个问题明显就是能测出 ai 的优劣,发在网上就是想和大家讨论 AI ,而不是和你们胡搅蛮缠语法。

    以后我不会在中文论坛分享任何内容了。
    wallriding
        120
    wallriding  
       73 天前
    @dtla #118 别人回复我了,我不能回复别人?回了就是杠?论坛你开的呀?哎,大哥。
    wallriding
        121
    wallriding  
       73 天前
    当别人指出我的英语表达有问题

    反应 1:太好了我看一下是不是真的有问题

    反应 2:我在美国工作了 X 年,我有 A 国 B 国 C 国的同事,我的口语很好,原文是别人写的你别找我你找原作者,blablablabla
    qq135449773
        122
    qq135449773  
       73 天前
    可是异常处理统称叫 Error Handling 吧?

    只说一个 error 谁知道你是要了解 Error Handling 还是 difference between Error and Exception ?

    你觉得呢?
    qq135449773
        123
    qq135449773  
       73 天前
    也可能叫 Exception handling ,两种表达印象里都见过
    williamcc
        124
    williamcc  
       73 天前
    1124 模型在哪里使用?楼主
    dtla
        125
    dtla  
    OP
       73 天前
    @williamcc 我说错了,是 0125 模型,直接用 api 调用就好了,官网有。


    @qq135449773 java 没有 error handling 的说法,只有 Exception handling 。error 就是 error 类,参见 Oracle 的官方文档。error 不建议 handle ,只有 exception 才需要 handle 。

    所以对 error 要做的事情是先检查是什么 error ,99%的情况是不能 try-catch 的
    williamcc
        126
    williamcc  
       73 天前
    @dtla 0125 api 需要开 plus 吗 大佬 甩个网址呗
    dtla
        127
    dtla  
    OP
       73 天前
    @williamcc api 是 API 呢,不需要 plus ,你去 openai 官网,就有 api 就好了。
    hulooq
        128
    hulooq  
       73 天前
    > gemini-pro 的回复

    **How do you deal with the error?**

    1. **Identify the error.**
    2. **Determine the cause of the error.**
    3. **Fix the error.**
    4. **Test the fix to ensure that the error is resolved.**
    5. **Document the error and the fix.**
    6. **Implement measures to prevent the error from recurring.**
    dtla
        129
    dtla  
    OP
       73 天前
    @hulooq 加一句,should i use try-catch
    jones2000
        130
    jones2000  
       73 天前
    1. 自己发现的 error, 随手就改掉
    2. 其他人发现的 error, 让他发 issue 出来, 然后根据提交的 issue 的描述信息修正。
    dtla
        131
    dtla  
    OP
       73 天前
    > 这种文字游戏的问题,还没有 i++等于多少有意义。
    > 你想用来自 PayPal 来证明“权威”。楼上有个 openjdk 的 author 算不算另外一种“权威”


    @qinxi 刚刚才看到你这条消息,这个自称 openjdk 的 author 不过是北美的一个学生(看他发帖记录)@Tabjy ,我再不济也是一个美国的 Senior SDE ,你觉得他更权威?贡献了一点 openjdk 代码就叫作 author 了?

    我这么跟你说把,他在这条帖子里说的话没有一条是对的。
    qinxi
        132
    qinxi  
       73 天前
    @dtla #131 你猜猜我为什么带上了引号, 自始至终我都觉得玩文字游戏来测试 AI 也好, 面试真候选人也好都是没有意义的.
    尤其是何况你还删除了能减小误解的部分, 故意测试文字游戏的影响
    dtla
        133
    dtla  
    OP
       73 天前
    @qinxi 文字游戏才能测试 AI 的能力,著名“鲁迅和周树人的关系”就是辨别 3.5 和 4.0 的分水岭,这到面试题本质上没有和这个问题有任何区别,只是比“鲁迅和周树人的关系”这道题更高深罢了。

    对于 AI 模型的区别,我不知道你是做什么工作的,我反正每天都离不开,选择一款好的 AI 模型对我的工作至关重要。
    dtla
        134
    dtla  
    OP
       73 天前
    算了,这个帖子就是被一群什么都不懂自以为是的小屁孩歪楼的,我看你也不是很懂。 @qinxi

    下面是其他的想法:

    看见他说是 openjdk 的 author 一瞬间我真的质疑了我自己,我在美国做 java senior sde 这么多年,竟然被一个小孩子唬住了,说明我确实需要继续学习。

    也许楼层里面质疑和骂我的人,现实世界就是个 loser 吧,不是很懂为什么我需要在乎
    dtla
        135
    dtla  
    OP
       73 天前
    以后不逛 V2EX 了,感觉 loser > 正常人的数量太多,不说其他的,我一个 senior 的 title ,质疑我的可能现实世界就是个 loser 吧,不说了,删号走人。
    NessajCN
        136
    NessajCN  
       73 天前   ❤️ 1
    https://i.4cdn.org/pol/1493993226750.jpg
    Let's count how how many logical fallacies OP had committed:
    [ad hominem]
    [appeal to authority]
    [appeal to emotion]
    [genetic]
    [tu quoque]
    ...
    Be free to add what I missed.
    makerbi
        137
    makerbi  
       73 天前
    单纯从一道题目来看大语言模型的性能还是有失偏颇,评测肯定是从多个维度多方面评价的。单一题目考核最容易出现的问题是数据泄露的问题,即原题目本身出现在了模型训练数据里,这是目前很多 LLM 榜单存在的问题(当然也有对应的检测和新的考核方案)。

    对于这道题目本身,对比了几个模型的输出,除了 OpenAI 外,ChatGLM 和 Qwen 看起来都还行。
    https://vectorvein.com/public/workflow-run-record/04ef976b300848b9b0318dc233b8f29d

    我倾向于还是训练数据的问题,不完全能代表模型能力本身。目前一个热点研究也是在小模型上增加更多的训练数据达到更好的效果。
    Inevitable
        138
    Inevitable  
       73 天前
    看楼主回复记录
    @LUO12826 看了眼,绝了
    huangzongzhuan
        139
    huangzongzhuan  
       73 天前
    退一万步来说,仅凭一个 java 面试题目就敢断言 “google 家的所有 AI 全部垃圾,copilot Pro 也垃圾。”,楼主你是不是有点不太严谨和自大呢?

    另外,谁规定论坛的谈论一定要限定在帖子的内容,而不能发散讨论其他方向?还是美国有这样的法律吗?

    楼主说自己在美国十几年,是精神美国人吗?还是已经转了国籍,成为真正美国人啦?

    我看了一下楼主你的回复,很多时候不都在说自己在美国混、中文论坛比不上外国论坛、拿 paypal 当权威来说事,这些东西。

    你给人感觉就是在外面呆了一下,自我感觉见识高了,拿着所谓的国外面试题自己做了些简单的试验,草率地得出一个结论,以为发现了什么新大陆,然后抱着 “如果把这个结论发到中文论坛,肯定能让那群人长长见识的” 的心情来发了个贴。

    谁知道那群人居然敢提出其他意见和看法,严重地违背了你的预期和伤害了你的自尊心。
    seasonsolt
        140
    seasonsolt  
       73 天前
    我的 0125 也不能正确回答,可能楼主没有情况上下文重新提问吧。但是把 “the error” 更换成 “the java.lang.Error”...哪怕 3.5 回答的也很好,所以无论是实验设置,还是实验结论我都不是很认可
    ceeeeeeeeeeeeeeb
        141
    ceeeeeeeeeeeeeeb  
       72 天前
    @huangzongzhuan 这回不得不回 reddit 了😭
    kylix
        142
    kylix  
       72 天前
    好走不送。我也来一句蹩脚英文:"Who care?"
    afantwtz
        143
    afantwtz  
       72 天前
    dtla:“以后不逛 V2EX 了,感觉 loser > 正常人的数量太多,不说其他的,我一个 senior 的 title ,质疑我的可能现实世界就是个 loser 吧,不说了,删号走人。”
    ----------------------------------------------------------------------------------------------------------------------------------------------
    OP 确确实实才是中文社区的魅力所在,回你的 reddit 去吧,帮助中文社区更好人人有责。唉,中文社区。“质疑我的可能现实世界就是个 loser 吧”这句话莫名其妙戳中我的笑点。
    yepsean
        144
    yepsean  
       72 天前
    @dtla 虽然楼主删号了看不到回复,但还是想表态下,被楼主的无理取闹惊到了,还可以这样?
    sxfscool
        145
    sxfscool  
       71 天前
    @yepsean 没删呢,还在高强度冲浪
    yepsean
        146
    yepsean  
       70 天前
    @sxfscool 那又惊到我一次,还可以这样 😂

    不过也合理,跟人设吻合
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1196 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 73ms · UTC 18:30 · PVG 02:30 · LAX 11:30 · JFK 14:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.