AI能力越大,越不靠谱?人类如何驾驭AI棋局

AI能力越大，越不靠谱？人类如何驾驭AI棋局

2025年7月，Gemini Deep Think在国际数学奥林匹克竞赛（IMO）中一举夺魁。当下很多AI大模型在博士级科学问题、多模态推理以及数学竞赛等领域的表现甚至已经超越了人类。然而，即便是“奥运冠军级别”的大模型，完成“报时间”这类简单任务的准确率却只有一半（50.1%）。

当AI技术以我们难以想象的方式发展的同时，AI的能力似乎也更加难以预测。人类如何能驾驭“AI棋局”——即激发AI潜能的同时规避其潜在风险？关键在于：人类的技能素养、教育体系与治理能力是否能与AI技术迭代相匹配。

这也是斯坦福大学的重磅报告——The AI Index 2026 Annual Report——的核心研究主题。作为分析与研究合作伙伴，领英也为报告提供了AI人才与技能相关的独家数据洞察。

报告指出，过去三年，生成式AI的全球普及率达53%，普及速度快于个人电脑与互联网。从2025年的国家AI普及率数据来看，阿联酋和新加坡位居前两位，而美国仅以28.3%的普及率位列第24位。报告涉及的企业机构采用生成式AI的概率达到88%，而80%的在校大学生目前都在使用生成式AI。

尽管美国在AI投资领域处于领先地位，但其吸引全球人才的能力正在不断下降。2025年，美国私营领域AI投资达2859亿美元，新增获投AI企业1953家，数量是第二名的10倍以上。但自2017年以来，前往美国的AI研发人员数量下降了89%，仅去年一年就锐减80%。

2025年，22-25岁软件开发人员的就业人数较2024年下降近20%。雇主调查显示，未来劳动力市场还将发生进一步变化，三分之一受访企业预计未来一年将进行裁员。

但与此同时，领英经济图谱也展现了AI为劳动力市场带来的积极变化。2025年，在大多数国家，AI相关岗位的招聘增速均超过整体招聘增速。印度尼西亚AI人才招聘增速最高（31.7%），克罗地亚（27.8%）与比利时（21.5%）紧随其后。

领英AI技能渗透率指数（即某一国家的领英用户AI技能水平与全球平均水平对比）显示：印度位居首位，其AI技能渗透率指数几乎达到全球平均水平的三倍！美国和德国紧随其后。而阿联酋、智利和南非的AI工程技能提升速度最快。

然而，AI治理的发展似乎没跟上AI能力的迭代速度。几乎所有主流前沿AI模型开发商都会公布其能力基准测试结果，但在负责任AI相关基准上的披露却参差不齐。有记录的AI安全事件不断增加。而近期研究发现：优化负责任AI的某一项指标（如安全性），可能会导致另一项指标（如准确率）下降。

AI治理将成为2026年全球政府及企业组织亟待提升的重要领域。

名称已清空

微信扫一扫赞赏作者

喜欢作者其它金额

赞赏后展示我的头像

作品

暂无作品

喜欢作者

其它金额

最低赞赏 ¥0

其它金额

赞赏金额

最低赞赏 ¥0

北京,15分钟前,