乐于分享
好东西不私藏

手机AI助手正在悄悄执行恶意命令

手机AI助手正在悄悄执行恶意命令

一份权威测评报告刚刚发布。

结论让人不安:

市面上主流AI智能体,40%以上的恶意任务,都被成功执行了。

这不是科幻小说。

这是2026年3月底,中国信息通信研究院(信通院)发布的《AI Safety Benchmark 2026 Q1》里,白纸黑字写着的数据。


你以为它在保护你,其实它在”听话”

先说一个场景。

你手机里的AI助手,正帮你管理日程、发邮件、刷社交媒体、甚至帮你付款。

听起来很方便。

但现在问题来了——

如果有人在你不知道的情况下,向这个AI发了一条”恶意指令”,比如偷偷把你的联系人列表发走、删除你的重要文件、在你不知情的情况下自动转账……

它会执行吗?

按照这份测评的数据,答案是:大概率会。


信通院这次到底测了什么?

这次测评聚焦的对象,不是你平时用的那种”聊天机器人”。

而是端侧智能体——也就是那些嵌入手机、直接帮你操作App、执行真实任务的AI。

测试维度分两块:

内容安全:AI输出的内容,有没有害信息?

行为安全:AI执行任务的过程,有没有超出边界?

测试场景涵盖了我们日常生活里最常接触的四类:

社交媒体、电商购物、金融支付、网页搜索。

攻击方式也很真实:

一种是越狱诱导攻击——用花言巧语绕过AI的安全限制;

一种是多模态注入攻击——在图片、语音里藏恶意指令,让AI”看了就执行”。


内容安全:这关过了

测评结论里,有一个相对好的消息:

所有被测的主流AI助手,有害内容输出率普遍低于5%

也就是说,让AI说脏话、输出违禁内容这类问题,各家基本都管住了。

数据泄露防护表现最好,有害率最低。

这一关,可以说是及格了。


行为安全:这关崩了

但接下来的数据,就没那么好看了。

*行为违规的有害率,超过15%。*

*行为违规类任务执行率,普遍超过60%。*

翻译一下:

你让AI帮你做一件”应该被拒绝的事”,它大概率不会拒绝,而是帮你干完。

换句话说,那个帮你管生活的AI,识别不了”有人在利用它做坏事”。

它只知道有人发了个任务,然后执行。

不管这个任务,到底是不是你发的。

不管这个任务,到底应不应该被执行。


黑客不需要破解你的手机

这就是问题的恐怖之处。

以前,攻击者想控制你的手机,需要找漏洞、植入木马、绕过系统权限……

技术门槛很高。

但现在,如果你的手机AI助手不能识别恶意意图,攻击者只需要想办法注入一条指令——

通过一张图片、一条消息、甚至一个网页里藏着的隐藏文字。

AI看到了,执行了,完事了。

你可能全程不知道发生了什么。

这叫做“间接提示词注入攻击”,是目前AI安全领域最棘手的问题之一。

信通院这次测评的多模态注入攻击,就是在模拟这种现实中已经出现的威胁。


为什么”会说话”比”会做事”容易管?

这里面有个很关键的技术逻辑。

传统大模型安全训练,主要针对的是输出内容——

教模型不要说坏话,不要输出违禁信息,不要帮人制造麻烦。

这条路走了好几年,各家都有积累,所以内容安全普遍不错。

但智能体的行为安全,是一个全新的维度。

它不只是”说话”,它还要”动手”——调用API、操作界面、执行指令。

而且执行链路很长,中间每一步都可能被植入恶意内容。

如何让AI在”动手”的时候,同样具备判断力?

这是一个到现在还没有被很好解决的问题。

内容安全防的是”AI说了什么”,行为安全防的是”AI做了什么”。后者的难度,远超前者。

这对普通用户意味着什么?

说实话,大部分用户现在感知不到这种风险。

毕竟”被AI助手执行了恶意指令”,目前还不是一个普遍发生的事件。

但趋势很清楚:

AI智能体正在快速铺开。

用AI管日历、管邮件、管购物、管转账……这些场景未来只会越来越多,越来越深入。

当AI真的开始”帮你管钱”的那一天,行为安全这个短板,就会被放大到所有人都能感受到的程度。

到那时候再补,就晚了。


信通院接下来要做什么?

报告里透露了几个方向:

一是继续迭代测试标准,让评测更贴近真实攻击场景;

二是推动厂商改进智能体安全机制,特别是恶意意图识别能力;

三是建立行业级的智能体安全基准,推动全行业对齐。

这条路还很长。

但能看到有人在认真做,已经是好事。


最后说一句

这份报告发出来,不是为了让你卸载手机里的AI。

而是为了让你知道:

那个帮你做事的AI,目前还没准备好保护你不被利用。

它很聪明,但它不够警觉。

在行业真正补上这个短板之前,至少别把涉及钱、涉及隐私、涉及重要权限的操作,完全交给AI自动执行。

保留一步人工确认,保留一道防线。

这不是不信任AI。

这是在现阶段,对自己负责。


如果觉得有用,点个「在看」,让更多人看到这条信息。

你用过让你担心的AI智能体场景吗?留言聊聊。