AI能力越大,越不靠谱?人类如何驾驭AI棋局
AI能力越大,越不靠谱?人类如何驾驭AI棋局
2025年7月,Gemini Deep Think在国际数学奥林匹克竞赛(IMO)中一举夺魁。当下很多AI大模型在博士级科学问题、多模态推理以及数学竞赛等领域的表现甚至已经超越了人类。然而,即便是“奥运冠军级别”的大模型,完成“报时间”这类简单任务的准确率却只有一半(50.1%)。
当AI技术以我们难以想象的方式发展的同时,AI的能力似乎也更加难以预测。人类如何能驾驭“AI棋局”——即激发AI潜能的同时规避其潜在风险?关键在于:人类的技能素养、教育体系与治理能力是否能与AI技术迭代相匹配。
这也是斯坦福大学的重磅报告——The AI Index 2026 Annual Report——的核心研究主题。作为分析与研究合作伙伴,领英也为报告提供了AI人才与技能相关的独家数据洞察。
报告指出,过去三年,生成式AI的全球普及率达53%,普及速度快于个人电脑与互联网。从2025年的国家AI普及率数据来看,阿联酋和新加坡位居前两位,而美国仅以28.3%的普及率位列第24位。报告涉及的企业机构采用生成式AI的概率达到88%,而80%的在校大学生目前都在使用生成式AI。
尽管美国在AI投资领域处于领先地位,但其吸引全球人才的能力正在不断下降。2025年,美国私营领域AI投资达2859亿美元,新增获投AI企业1953家,数量是第二名的10倍以上。但自2017年以来,前往美国的AI研发人员数量下降了89%,仅去年一年就锐减80%。
2025年,22-25岁软件开发人员的就业人数较2024年下降近20%。雇主调查显示,未来劳动力市场还将发生进一步变化,三分之一受访企业预计未来一年将进行裁员。
但与此同时,领英经济图谱也展现了AI为劳动力市场带来的积极变化。2025年,在大多数国家,AI相关岗位的招聘增速均超过整体招聘增速。印度尼西亚AI人才招聘增速最高(31.7%),克罗地亚(27.8%)与比利时(21.5%)紧随其后。
领英AI技能渗透率指数(即某一国家的领英用户AI技能水平与全球平均水平对比)显示:印度位居首位,其AI技能渗透率指数几乎达到全球平均水平的三倍!美国和德国紧随其后。而阿联酋、智利和南非的AI工程技能提升速度最快。
然而,AI治理的发展似乎没跟上AI能力的迭代速度。几乎所有主流前沿AI模型开发商都会公布其能力基准测试结果,但在负责任AI相关基准上的披露却参差不齐。有记录的AI安全事件不断增加。而近期研究发现:优化负责任AI的某一项指标(如安全性),可能会导致另一项指标(如准确率)下降。
AI治理将成为2026年全球政府及企业组织亟待提升的重要领域。
夜雨聆风