AI在ARC测试得0分!但我一点都不慌
AI在ARC测试得0分!但我一点都不慌
GPT-5.5和Claude Opus 4.7,在ARC-AGI-3测试里,双双得了0分。
满分100,人类平均95。
然后全网炸了,AI药丸、泡沫破灭、大模型到头……
说实话,我没觉得这事有多大。
为什么
ARC-AGI这个测试,考的是自适应推理能力。给你几个格子,让你找规律填颜色。
人类一看就懂,AI一头雾水。
但问题是:这个能力和我们实际工作中用到的能力,有多大关系?
写代码不需要找格子颜色, 做分析不需要推理3×3网格, 写文章更不需要理解抽象图案。
AI在真实任务上的表现,和在一个学术测试上的表现,是两回事。
我的观点
测试结果反映的是能力边界,不是能力高度。
AI确实有短板,确实有很多做不到的事。但它能做到的事,已经足够改变很多行业了。
一个工具好不好用,看它能帮你解决多少问题,不看它在一个特定测试上能不能拿满分。
按照这个逻辑,Claude帮我写代码、帮我debug、帮我解释代码——它就是好工具,不管它ARC能考多少分。
留给评论区
你们怎么看?
AI在一个测试上得0分,会影响你用它吗?
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
作者提示: 个人观点,仅供参考
浙江,1分钟前,
夜雨聆风