AI前沿日报 05.13|Mini Shai-Hulud攻击扩散,Amazon上线Alexa购物助手

01 今日速览

Microsoft Threat Intelligence 披露，mistralai PyPI 包 v2.4.6 被注入恶意代码；Aikido Security 统计显示，Mini Shai-Hulud 攻击已扩散到 169 个 npm 包名、373 个恶意版本，波及 TanStack、Mistral、UiPath 等生态。
Amazon 推出 Alexa for Shopping，把 Rufus 的商品搜索能力和 Alexa+ 的个性化能力合并，用户可以在 Amazon 搜索栏里让AI比较商品、追踪价格、生成购物指南和设置自动购买。
Ramp 最新 AI Index 显示，Anthropic 在企业采用率上首次超过 OpenAI：4月 Anthropic 采用率为 34.4%，OpenAI 为 32.3%。
Meta 给 WhatsApp 里的 Meta AI 推出 Incognito Chat，用户可以和AI进行不会保存记录的临时对话，Meta 称对话内容对其也不可见。
中美峰会前，AI 被列为重要议题之一，但 Reuters 报道认为，双方在芯片限制、模型安全、知识产权和技术竞争上的不信任仍会压低谈判预期。
Axios 报道，美国白宫AI行政行动因内部意见分歧暂时搁置，争议集中在前沿模型测试由哪个部门主导、是否建立更强的安全审查机制等问题。
Altman 在 Musk 诉 OpenAI 案中作证，否认 OpenAI 与 Microsoft 背离非营利初衷、转向商业利益的核心指控。
今日 skill 推荐是 scientific-agent-skills，它把研究、分析、金融和写作任务拆成可复用流程，更适合做公司拆解、论文解读和赛道研究。
Hugging Face 今日值得关注的论文方向包括在线记忆、世界动作模型、多Agent测试时计算和直接语料检索，分别对应长期助手、机器人、复杂推理和研究型Agent检索。

02 模型 / 产品 / 开发者更新

1. Amazon 上线 Alexa for Shopping，把购物助手放进搜索栏

Amazon 今日推出 Alexa for Shopping。这个产品把原来的 Rufus 购物助手和 Alexa+ 合并，直接放进 Amazon Shopping App、网页端和 Echo Show。用户可以在搜索栏里用自然语言提问，比如比较两款耳机、找适合露营的装备、生成购物指南、追踪某件商品价格，也可以设置“价格低于某个数时自动加入购物车”。Amazon 官方称，Rufus 在 2025 年已经帮助超过 3 亿用户研究、比较和购买商品。

这次变化的关键在于，Amazon 把AI购物助手放到了交易路径中。过去电商搜索通常是输入关键词、浏览列表、自己比较参数；Alexa for Shopping 希望把“搜索—比较—追踪价格—购买—复购”串成对话流程。它也会利用用户的 Amazon 购物历史和 Alexa+ 的上下文，让推荐更贴近个人需求。

这条可以和前几天阿里将 Qwen 接入淘宝放在一起看。阿里侧强调Qwen进入淘宝和天猫商品库，Amazon侧把Alexa放进搜索栏和Echo Show，两个动作都说明大型电商平台正在把AI助手从“客服问答”推进到“商品发现和交易决策”。

2. Anthropic 企业采用率首次超过 OpenAI

Ramp 最新 AI Index 显示，Anthropic 在企业采用率上首次超过 OpenAI。4月，Ramp 客户中采用 Anthropic 的比例为 34.4%，OpenAI 为 32.3%；整体AI采用率为 50.6%。Ramp 的数据来自企业支付行为，包括企业卡和发票付款，因此它反映的是企业真实采购和使用情况，而不是社交媒体热度。

这个变化和最近几周的企业场景动作有关。Anthropic 在 Claude Code、金融Agent模板、企业知识工作、安全审查等场景中频繁出现；OpenAI 仍然拥有更强的消费端品牌和更广泛的通用产品认知，但企业市场正在变得更分散。一个月数据不能说明长期胜负，但它说明企业客户在前沿模型供应商之间的选择已经不再单一。

3. Meta 给 WhatsApp AI 聊天增加隐身模式

Meta 今日为 WhatsApp 里的 Meta AI 推出 Incognito Chat。用户可以开启临时AI对话，内容不会保存在聊天记录中，关闭应用或锁屏后会话结束。WhatsApp 官方称，该功能建立在 Private Processing 技术之上，对话内容对其他人不可见，也不会用于后续保留上下文。

这条更新解决的是AI对话中的隐私问题。用户越来越常把健康、感情、财务、工作、人际关系等敏感问题交给AI，但很多问题并不适合长期留在历史记录里。Incognito Chat 给用户提供了一个“临时问一下”的入口。当前该模式主要支持文本，图片上传等能力仍有限制。

4. Adaption 推出 AutoScientist，瞄准自动化模型训练

Adaption 发布 AutoScientist，目标是让模型训练和微调过程更自动化。可以把它理解成一个“自动研究助手”：传统微调需要人选择数据、设置任务、调整参数、评估结果；AutoScientist 希望让系统自己尝试不同训练方案，并根据实验反馈继续改进。

这类工具的核心价值在于减少模型适配成本。很多企业或团队并不需要从零训练大模型，但需要让模型学会某个领域任务，比如客服规则、法律检索、代码风格或金融分析。自动化训练工具如果能稳定工作，会让小团队更容易把通用模型改造成专用模型。

03 开源 / 开发者生态

今日 skill 推荐：dev-agent-skills

今天推荐 dev-agent-skills。它是一组面向 Claude Code 的开发工作流 skills，重点补的是 Git / GitHub 场景，比如分支管理、提交信息、PR 准备、代码审查和协作流程。项目说明里提到，这些 skills 的作用是给 Claude 加一套结构化步骤，避免它直接跳到写代码或随意改动仓库。

04 论文雷达

1. δ-mem：给长期AI助手做在线记忆

Hugging Face 今日列表中，δ-mem 关注在线记忆。在线记忆可以理解为：AI在使用过程中不断接触新信息、用户偏好和任务历史，系统要决定哪些信息该保留、哪些该忘掉、什么时候调用旧记忆。

这对个人助手和企业助手都很关键。一个长期AI助手如果每次都从零开始，效率很低；但如果什么都记，又会带来隐私、错误继承和上下文污染。在线记忆研究要解决的就是“记什么、怎么记、什么时候用”的问题。

2. World Action Models：让模型理解动作之后世界会怎么变

World Action Models 关注具身智能。可以把它理解成一种“动作后果预测模型”：机器人不只要知道杯子在哪里，还要预测手伸过去、抓住、抬起之后，杯子、桌面和手的位置会怎样变化。

这类能力对机器人和自动驾驶都很重要。真实世界里的行动会改变环境，模型如果只会识别画面，无法可靠执行复杂动作。它需要理解动作、物体、空间和后果之间的关系。

3. TMAS：用多Agent提高测试时计算效率

TMAS: Scaling Test-Time Compute via Multi-Agent Synergy 关注测试时计算。测试时计算指的是模型在回答问题时多思考几步、多生成几条路线，再选择更好的答案。TMAS 把这个过程做成多Agent协作，让不同Agent探索不同解题路径。

这类方法适合数学、代码、搜索和复杂推理任务。真正需要判断的是，多花的计算能不能换来足够高的正确率提升。对企业应用来说，准确率、延迟和成本必须一起看。

4. Direct Corpus Interaction：让Agent直接查原始语料

Direct Corpus Interaction 提出让Agent直接使用 grep、find、bash、shell pipeline 等工具查原始语料，而不是先把所有资料做向量索引。

这个思路很适合代码和研究任务。向量检索适合找语义相似内容，但有时用户需要精确找某个函数名、错误码、日志片段、公司名称或政策原文。让Agent像开发者查代码一样查资料，可能比一次性top-k检索更可靠。

05 X动向

1. Microsoft Threat Intelligence：披露 mistralai PyPI 包被攻击

Microsoft Threat Intelligence （微软威胁情报团队）在 X 上披露，mistralai PyPI 包 v2.4.6 被注入恶意代码，导入时会下载并运行伪装成 Hugging Face Transformers 的二阶段payload。

2. Aikido Security：Mini Shai-Hulud 已扩散到169个npm包名

Aikido Security 在博客和X上更新称，Mini Shai-Hulud 已扩散到169个npm包名，产生373个恶意版本，影响 TanStack、UiPath、Mistral 等生态。Aikido 的分析还强调，这一轮攻击会窃取 GitHub、npm、云服务和CI/CD密钥，并继续借助发布流程传播。

06 公司 / 应用 / 政策动态

1. 中美峰会前，AI成为重要议题之一

Reuters 报道，特朗普访华期间预计会把AI列为与中国领导人会谈的重要议题。报道提到，Anthropic Mythos 的发布让美国更关注AI安全和模型能力扩散，双方可能讨论AI沟通渠道、减少误用、模型安全护栏等方向。

但外界预期不高。中美在芯片出口管制、模型访问、知识产权、网络安全和技术竞争上分歧很深。短期更可能出现的是沟通机制或风险热线的讨论，而不是实质性AI合作协议。

2. 美国AI行政行动因内部争议暂时搁置

Axios 报道，美国白宫关于AI的行政行动暂时搁置，原因包括政府内部意见分歧和中美峰会议程压力。争议点包括前沿模型测试应由商务部主导，还是放在国家安全机构下；以及政府是否应该建立类似药品审批的AI安全证明机制。

3. Altman 在 Musk 诉 OpenAI 案中作证

Axios 报道，Sam Altman 在 Elon Musk 起诉 OpenAI / Microsoft 的庭审中出庭作证，否认OpenAI与Microsoft背离非营利初衷、转向商业利益的核心指控。Musk 一方称 OpenAI 变成了一个由商业利益驱动的组织，Altman 则表示安全使命仍然重要，商业化是为了获得足够资源开发强大AI。

这场诉讼继续影响外界对OpenAI治理结构的讨论。问题不只是两位创始人之间的纠纷，也涉及非营利使命、微软合作、算力需求、融资压力和AI安全承诺之间的博弈。