当前时间: 2026-05-20 16:23:51
分类:办公文件
评论(0)
AI也会考到怀疑人生:人类最后d 考试有多难大家可能听说过一项 AI 基准测试,名字叫 Humanity’s Last Exam,直译就是“人类最后的考试”。虽然名字里有人类,但这却是为AI准备的,是一套专门用来测试顶级 AI 模型的专家级题库。它一共有约 2500 道题,覆盖数学、物理、化学、生物医学、计算机、语言学、古典学、人文社科等 100 多个学科。重点是:这些题不是高中竞赛那种难,而是很多都需要非常细分领域的专家知识。比如古典学题,会给你一段罗马墓碑上的 Palmyrene script,让你翻译碑文。生态解剖题,问蜂鸟身体里某块特殊籽骨到底支撑几对肌腱,答案还要求只写数字。语言学题,给你《诗篇》里的希伯来文本,让你根据 Tiberian pronunciation 的最新研究,找出所有闭音节。数学题,直接上范畴论、对称群、natural cotransformations 这种内容。计算机题也不是简单写代码,而是给你图上的 Markov chain,问哪些图类会收敛到唯一且均匀的平稳分布。还有有机化学题,看反应路径,判断电环化是几 π 电子、conrotatory 还是 disrotatory,后面还接环加成类型。看完大多数人的第一反应是:这不是“人类最后的考试”,这是“人类专家的冷门知识库存盘点”。它有意思的地方在于,很多 AI 在这些题上不是单纯不会,而是会很自信地答错。这其实比“不知道”更值得注意。所以 HLE 测的不是 AI 会不会背知识,而是在面对真正陌生、细分、专家级问题时,它到底有没有可靠推理能力,以及能不能承认自己不确定。某种程度上,这套题也提醒我们:AI 已经很强了,但“像专家一样知道自己不知道什么”,可能还是另一道坎。#AI #人工智能 #HumanitysLastExam #AI测评 #大模型 #知识边界 #科技前沿 #认知升级 #学习分享有兴趣进一步了解的同学可以到这里深入了解:https://huggingface.co/datasets/cais/hle
基本
文件
流程
错误
SQL
调试
- 请求信息 : 2026-05-20 16:37:48 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/651692.html
- 运行时间 : 0.147903s [ 吞吐率:6.76req/s ] 内存消耗:4,708.56kb 文件加载:145
- 缓存信息 : 0 reads,0 writes
- 会话信息 : SESSION_ID=53a0eebc42c9051bc8b81c744806a45e
- CONNECT:[ UseTime:0.001039s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4
- SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.001818s ]
- SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.002809s ]
- SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.000700s ]
- SHOW FULL COLUMNS FROM `set` [ RunTime:0.001677s ]
- SELECT * FROM `set` [ RunTime:0.002812s ]
- SHOW FULL COLUMNS FROM `article` [ RunTime:0.001839s ]
- SELECT * FROM `article` WHERE `id` = 651692 LIMIT 1 [ RunTime:0.001123s ]
- UPDATE `article` SET `lasttime` = 1779266268 WHERE `id` = 651692 [ RunTime:0.001488s ]
- SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.000691s ]
- SELECT * FROM `article` WHERE `id` < 651692 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.001170s ]
- SELECT * FROM `article` WHERE `id` > 651692 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.002148s ]
- SELECT * FROM `article` WHERE `id` < 651692 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.003149s ]
- SELECT * FROM `article` WHERE `id` < 651692 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.007185s ]
- SELECT * FROM `article` WHERE `id` < 651692 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.006452s ]
0.151919s