AI在ARC测试得0分!但我一点都不慌

AI在ARC测试得0分！但我一点都不慌

GPT-5.5和Claude Opus 4.7，在ARC-AGI-3测试里，双双得了0分。

满分100，人类平均95。

然后全网炸了，AI药丸、泡沫破灭、大模型到头……

说实话，我没觉得这事有多大。

为什么

ARC-AGI这个测试，考的是自适应推理能力。给你几个格子，让你找规律填颜色。

人类一看就懂，AI一头雾水。

但问题是：这个能力和我们实际工作中用到的能力，有多大关系？

写代码不需要找格子颜色，做分析不需要推理3×3网格，写文章更不需要理解抽象图案。

AI在真实任务上的表现，和在一个学术测试上的表现，是两回事。

我的观点

测试结果反映的是能力边界，不是能力高度。

AI确实有短板，确实有很多做不到的事。但它能做到的事，已经足够改变很多行业了。

一个工具好不好用，看它能帮你解决多少问题，不看它在一个特定测试上能不能拿满分。

按照这个逻辑，Claude帮我写代码、帮我debug、帮我解释代码——它就是好工具，不管它ARC能考多少分。

留给评论区

你们怎么看？

AI在一个测试上得0分，会影响你用它吗？

名称已清空

微信扫一扫赞赏作者

喜欢作者其它金额

赞赏后展示我的头像

作品

暂无作品

喜欢作者

其它金额

最低赞赏 ¥0

其它金额

赞赏金额

最低赞赏 ¥0

作者提示: 个人观点，仅供参考

浙江,1分钟前,