01 今日速览
Microsoft Threat Intelligence 披露, mistralaiPyPI 包 v2.4.6 被注入恶意代码;Aikido Security 统计显示,Mini Shai-Hulud 攻击已扩散到 169 个 npm 包名、373 个恶意版本,波及 TanStack、Mistral、UiPath 等生态。Amazon 推出 Alexa for Shopping,把 Rufus 的商品搜索能力和 Alexa+ 的个性化能力合并,用户可以在 Amazon 搜索栏里让AI比较商品、追踪价格、生成购物指南和设置自动购买。 Ramp 最新 AI Index 显示,Anthropic 在企业采用率上首次超过 OpenAI:4月 Anthropic 采用率为 34.4%,OpenAI 为 32.3%。 Meta 给 WhatsApp 里的 Meta AI 推出 Incognito Chat,用户可以和AI进行不会保存记录的临时对话,Meta 称对话内容对其也不可见。 中美峰会前,AI 被列为重要议题之一,但 Reuters 报道认为,双方在芯片限制、模型安全、知识产权和技术竞争上的不信任仍会压低谈判预期。 Axios 报道,美国白宫AI行政行动因内部意见分歧暂时搁置,争议集中在前沿模型测试由哪个部门主导、是否建立更强的安全审查机制等问题。 Altman 在 Musk 诉 OpenAI 案中作证,否认 OpenAI 与 Microsoft 背离非营利初衷、转向商业利益的核心指控。 今日 skill 推荐是 scientific-agent-skills,它把研究、分析、金融和写作任务拆成可复用流程,更适合做公司拆解、论文解读和赛道研究。 Hugging Face 今日值得关注的论文方向包括在线记忆、世界动作模型、多Agent测试时计算和直接语料检索,分别对应长期助手、机器人、复杂推理和研究型Agent检索。
02 模型 / 产品 / 开发者更新
1. Amazon 上线 Alexa for Shopping,把购物助手放进搜索栏
Amazon 今日推出 Alexa for Shopping。这个产品把原来的 Rufus 购物助手和 Alexa+ 合并,直接放进 Amazon Shopping App、网页端和 Echo Show。用户可以在搜索栏里用自然语言提问,比如比较两款耳机、找适合露营的装备、生成购物指南、追踪某件商品价格,也可以设置“价格低于某个数时自动加入购物车”。Amazon 官方称,Rufus 在 2025 年已经帮助超过 3 亿用户研究、比较和购买商品。
这次变化的关键在于,Amazon 把AI购物助手放到了交易路径中。过去电商搜索通常是输入关键词、浏览列表、自己比较参数;Alexa for Shopping 希望把“搜索—比较—追踪价格—购买—复购”串成对话流程。它也会利用用户的 Amazon 购物历史和 Alexa+ 的上下文,让推荐更贴近个人需求。
这条可以和前几天阿里将 Qwen 接入淘宝放在一起看。阿里侧强调Qwen进入淘宝和天猫商品库,Amazon侧把Alexa放进搜索栏和Echo Show,两个动作都说明大型电商平台正在把AI助手从“客服问答”推进到“商品发现和交易决策”。
2. Anthropic 企业采用率首次超过 OpenAI
Ramp 最新 AI Index 显示,Anthropic 在企业采用率上首次超过 OpenAI。4月,Ramp 客户中采用 Anthropic 的比例为 34.4%,OpenAI 为 32.3%;整体AI采用率为 50.6%。Ramp 的数据来自企业支付行为,包括企业卡和发票付款,因此它反映的是企业真实采购和使用情况,而不是社交媒体热度。
这个变化和最近几周的企业场景动作有关。Anthropic 在 Claude Code、金融Agent模板、企业知识工作、安全审查等场景中频繁出现;OpenAI 仍然拥有更强的消费端品牌和更广泛的通用产品认知,但企业市场正在变得更分散。一个月数据不能说明长期胜负,但它说明企业客户在前沿模型供应商之间的选择已经不再单一。
3. Meta 给 WhatsApp AI 聊天增加隐身模式
Meta 今日为 WhatsApp 里的 Meta AI 推出 Incognito Chat。用户可以开启临时AI对话,内容不会保存在聊天记录中,关闭应用或锁屏后会话结束。WhatsApp 官方称,该功能建立在 Private Processing 技术之上,对话内容对其他人不可见,也不会用于后续保留上下文。
这条更新解决的是AI对话中的隐私问题。用户越来越常把健康、感情、财务、工作、人际关系等敏感问题交给AI,但很多问题并不适合长期留在历史记录里。Incognito Chat 给用户提供了一个“临时问一下”的入口。当前该模式主要支持文本,图片上传等能力仍有限制。
4. Adaption 推出 AutoScientist,瞄准自动化模型训练
Adaption 发布 AutoScientist,目标是让模型训练和微调过程更自动化。可以把它理解成一个“自动研究助手”:传统微调需要人选择数据、设置任务、调整参数、评估结果;AutoScientist 希望让系统自己尝试不同训练方案,并根据实验反馈继续改进。
这类工具的核心价值在于减少模型适配成本。很多企业或团队并不需要从零训练大模型,但需要让模型学会某个领域任务,比如客服规则、法律检索、代码风格或金融分析。自动化训练工具如果能稳定工作,会让小团队更容易把通用模型改造成专用模型。
03 开源 / 开发者生态
今日 skill 推荐:dev-agent-skills
今天推荐 dev-agent-skills。它是一组面向 Claude Code 的开发工作流 skills,重点补的是 Git / GitHub 场景,比如分支管理、提交信息、PR 准备、代码审查和协作流程。项目说明里提到,这些 skills 的作用是给 Claude 加一套结构化步骤,避免它直接跳到写代码或随意改动仓库。
04 论文雷达
1. δ-mem:给长期AI助手做在线记忆
Hugging Face 今日列表中,δ-mem 关注在线记忆。在线记忆可以理解为:AI在使用过程中不断接触新信息、用户偏好和任务历史,系统要决定哪些信息该保留、哪些该忘掉、什么时候调用旧记忆。
这对个人助手和企业助手都很关键。一个长期AI助手如果每次都从零开始,效率很低;但如果什么都记,又会带来隐私、错误继承和上下文污染。在线记忆研究要解决的就是“记什么、怎么记、什么时候用”的问题。
2. World Action Models:让模型理解动作之后世界会怎么变
World Action Models 关注具身智能。可以把它理解成一种“动作后果预测模型”:机器人不只要知道杯子在哪里,还要预测手伸过去、抓住、抬起之后,杯子、桌面和手的位置会怎样变化。
这类能力对机器人和自动驾驶都很重要。真实世界里的行动会改变环境,模型如果只会识别画面,无法可靠执行复杂动作。它需要理解动作、物体、空间和后果之间的关系。
3. TMAS:用多Agent提高测试时计算效率
TMAS: Scaling Test-Time Compute via Multi-Agent Synergy 关注测试时计算。测试时计算指的是模型在回答问题时多思考几步、多生成几条路线,再选择更好的答案。TMAS 把这个过程做成多Agent协作,让不同Agent探索不同解题路径。
这类方法适合数学、代码、搜索和复杂推理任务。真正需要判断的是,多花的计算能不能换来足够高的正确率提升。对企业应用来说,准确率、延迟和成本必须一起看。
4. Direct Corpus Interaction:让Agent直接查原始语料
Direct Corpus Interaction 提出让Agent直接使用 grep、find、bash、shell pipeline 等工具查原始语料,而不是先把所有资料做向量索引。
这个思路很适合代码和研究任务。向量检索适合找语义相似内容,但有时用户需要精确找某个函数名、错误码、日志片段、公司名称或政策原文。让Agent像开发者查代码一样查资料,可能比一次性top-k检索更可靠。
05 X动向
1. Microsoft Threat Intelligence:披露 mistralai PyPI 包被攻击
Microsoft Threat Intelligence (微软威胁情报团队)在 X 上披露,mistralai PyPI 包 v2.4.6 被注入恶意代码,导入时会下载并运行伪装成 Hugging Face Transformers 的二阶段payload。
2. Aikido Security:Mini Shai-Hulud 已扩散到169个npm包名
Aikido Security 在博客和X上更新称,Mini Shai-Hulud 已扩散到169个npm包名,产生373个恶意版本,影响 TanStack、UiPath、Mistral 等生态。Aikido 的分析还强调,这一轮攻击会窃取 GitHub、npm、云服务和CI/CD密钥,并继续借助发布流程传播。
06 公司 / 应用 / 政策动态
1. 中美峰会前,AI成为重要议题之一
Reuters 报道,特朗普访华期间预计会把AI列为与中国领导人会谈的重要议题。报道提到,Anthropic Mythos 的发布让美国更关注AI安全和模型能力扩散,双方可能讨论AI沟通渠道、减少误用、模型安全护栏等方向。
但外界预期不高。中美在芯片出口管制、模型访问、知识产权、网络安全和技术竞争上分歧很深。短期更可能出现的是沟通机制或风险热线的讨论,而不是实质性AI合作协议。
2. 美国AI行政行动因内部争议暂时搁置
Axios 报道,美国白宫关于AI的行政行动暂时搁置,原因包括政府内部意见分歧和中美峰会议程压力。争议点包括前沿模型测试应由商务部主导,还是放在国家安全机构下;以及政府是否应该建立类似药品审批的AI安全证明机制。
3. Altman 在 Musk 诉 OpenAI 案中作证
Axios 报道,Sam Altman 在 Elon Musk 起诉 OpenAI / Microsoft 的庭审中出庭作证,否认OpenAI与Microsoft背离非营利初衷、转向商业利益的核心指控。Musk 一方称 OpenAI 变成了一个由商业利益驱动的组织,Altman 则表示安全使命仍然重要,商业化是为了获得足够资源开发强大AI。
这场诉讼继续影响外界对OpenAI治理结构的讨论。问题不只是两位创始人之间的纠纷,也涉及非营利使命、微软合作、算力需求、融资压力和AI安全承诺之间的博弈。
夜雨聆风