乐于分享
好东西不私藏

AI在ARC测试得0分!但我一点都不慌

AI在ARC测试得0分!但我一点都不慌

AI在ARC测试得0分!但我一点都不慌

GPT-5.5和Claude Opus 4.7,在ARC-AGI-3测试里,双双得了0分。

满分100,人类平均95。

然后全网炸了,AI药丸、泡沫破灭、大模型到头……

说实话,我没觉得这事有多大。

为什么

ARC-AGI这个测试,考的是自适应推理能力。给你几个格子,让你找规律填颜色。

人类一看就懂,AI一头雾水。

但问题是:这个能力和我们实际工作中用到的能力,有多大关系?

写代码不需要找格子颜色, 做分析不需要推理3×3网格, 写文章更不需要理解抽象图案。

AI在真实任务上的表现,和在一个学术测试上的表现,是两回事。

我的观点

测试结果反映的是能力边界,不是能力高度。

AI确实有短板,确实有很多做不到的事。但它能做到的事,已经足够改变很多行业了。

一个工具好不好用,看它能帮你解决多少问题,不看它在一个特定测试上能不能拿满分。

按照这个逻辑,Claude帮我写代码、帮我debug、帮我解释代码——它就是好工具,不管它ARC能考多少分。

留给评论区

你们怎么看?

AI在一个测试上得0分,会影响你用它吗?

名称已清空
微信扫一扫赞赏作者

喜欢作者其它金额
作品
暂无作品
喜欢作者
其它金额
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
作者提示: 个人观点,仅供参考
浙江,1分钟前,