1
aiqinxuancai 237 天前
感觉很多国内的有针对大家经常拿来玩梗的内容有过专门的优化,比如林黛玉倒拔垂杨柳、蓝牙耳机坏了看耳科医生还是牙科医生等等。让人看起来没那么弱智。
但是实际用起来,肯定不如 3.5 ,特别是问代码问题,根本不在一个层次上。 |
2
Byzliu 237 天前 via Android 1
写套话都差不多,写代码都不行,最近 3.5 降智也有点严重。
|
3
janzwong 237 天前
暂时没有,所以我一直用的 gpt4 。
|
4
justfindu 237 天前
暂时没有, 再过点时间的微调 , 应该是基本持平.
|
5
justfindu 237 天前
或者他们改用 llama 2.0 来进行训练微调
|
6
biu7 237 天前
发布会吹的很牛逼,接完 api 一测试全是垃圾 - -
|
7
elfive 237 天前 via iPhone
问一个问题就能知道了:
有一个很深的洞,洞口以初速度为 0 ,自由落体向洞内扔下一枚石头,60 秒后听到石头落到洞底地面的声音,假设重力加速度为 9.8m/s^2 ,声音在空气中的传播速度为 343m/s ,求这个洞有多深。 这个问题我在 ChatGPT3.5 上问了一次,然后纠正了两次,可以得出正确的解题过程,不过最后答案还是计算错误了。 在讯飞的那个 AI 即使纠正了 3 次依然说不出正确的解题思路。 其他的 AI 的没试过。 |
9
yangzzz 237 天前 1
都在宣称比 gpt3.5 牛逼,直逼 gpt4 能力,实际一用全露馅。不止推理能力,语言理解能力,甚至有些常识问题没法和 gpt3.5 相比。
|
10
dw2693734d 237 天前
|
11
janzwong 237 天前
@dw2693734d 你这是用了插件,我没用插件直接用 gpt4 问的,结果是 s≈7226.46 (米)
|
12
elfive 237 天前 via iPhone
|
13
dw2693734d 237 天前 via iPhone
|
14
SomeBodsy 237 天前
讯飞能用,但是远不如 gpt3.5;百度就是个智障,一问三不知
|
15
janzwong 237 天前
@dw2693734d #13 啊?不是只有插件或者代码解释器才有这个“finished working”么
|
16
dw2693734d 236 天前
@janzwong 代码解释器
|
17
dw2693734d 236 天前
@janzwong 只有代码解释器会调用 python 来做数学运算,这个就比较适合刚才的场景
|
18
VxJiahua 236 天前
这么说吧,chatgpt 4 搭配好 Prompt ,没一个能打的
|