Sapient Intelligence 于2026年5月18日发布了HRM-Text模型,该模型以约1B的参数规模,在MATH、GSM8K和ARC-Challenge等测试中取得了56.2、84.5和81.9的高分。其训练成本仅约1500美元,在16块H100 GPU上运行不到两天。与传统大模型依赖“更大参数、更多数据、更强算力”的增长路径不同,HRM-Text尝试在有限资源下,通过架构与训练目标的共同设计,显著提高计算产出效率。
HRM-Text的核心创新在于同时调整了模型“怎么算”和“学什么”。它引入了高层模块H和低层模块L的双时间尺度递归结构,让有限参数在输出前进行多轮内部计算,提高了有效计算深度。此外,模型只对回答部分计算损失,将训练信号更集中地用于任务理解和答案生成,而非预测无关文本。为确保深层递归训练的稳定性,HRM-Text还引入了MagicNorm和warmup deep credit assignment两项设计。
该研究团队同步开放了论文、模型权重和预训练代码。值得关注的是,图灵奖得主Yoshua Bengio作为共同作者参与发布了《Generative Recursive Reasoning》论文,直接沿着HRM所开创的分层递归推理路线展开研究,进一步证实了HRM架构在下一代推理型人工智能中的重要研究基础地位。这项成果提供了一个可复现的案例,表明除了扩大模型规模之外,重新设计计算结构同样可能改变性能、成本与能力之间的关系。

清华大学研究团队在CVPR 2026论文中提出了一种新型物理对抗方法,设计了一套特殊服装,使行人在现实世界中能够同时躲避可见光和热成像检测器。该研究名为NORP(non-overlapping RGB-T pattern),其核心思想是物理对抗服装上的每一个位置要么用于显示可见光图案,要么用于显示热成像图案,两者在空间中不重叠,避免了传统重叠式打印带来的亮度下降问题。
研究人员利用普通可打印布料承载可见光对抗图案,并使用常见铝膜材料改变局部热成像效果。为确保在不同观察角度下的有效性,团队构建了人体和服装的三维RGB-T模型,模拟全视角穿衣效果。同时,他们提出了空间离散-连续优化方法,解决了在同一位置优化RGB颜色和热成像材料的难题。
实验结果表明,该方法在数字世界中对不同RGB-T检测器(包括早期融合、中期融合、晚期融合及独立双模态检测器)的平均对抗成功率达到90%以上,在真实物理世界中达到60%的平均成功率。这表明即使是融合了可见光和热成像信息的多模态检测系统,也可能在现实世界中受到物理对抗样本的威胁,有助于推动未来更鲁棒、可靠的多模态感知系统发展。

阿里巴巴近期宣布重大人工智能组织架构调整,合并通义大模型事业部和未来生活实验室,成立Token Foundry(词元铸造厂)事业部。该事业部由阿里集团CEO吴泳铭直接负责,隶属于Alibaba Token Hub(ATH)事业群,与千问事业部、悟空事业部等平行。这一调整旨在打通阿里的模型研究和商业化探索,被视为阿里“AI驱动”战略的最强执行。
Token Foundry事业部将聚焦基础模型(由Qwen担纲)、视频生成模型(Happy Horse)和世界模型(Happy Oyster)三大方向。在通义大模型事业部的打磨下,Qwen已位列行业第一梯队,其最新旗舰版本Qwen 3.7 Max在Agent场景做了全面优化,并在国际权威评测平台Arena全球大模型盲测榜单中,位列国产模型第一。Happy Horse则在视频生成领域表现突出,被认为在电商、广告等生态内应用场景潜力巨大。Happy Oyster作为阿里首个开放式世界模型,则承担探索AI新技术路线的任务。
此次组织变阵体现了阿里对AI的持续加码,吴泳铭强调AI已跨越初期投入阶段,迈入大规模商业化回报周期,并预计百炼MaaS平台等AI模型与应用服务年化经常性收入(ARR)将突破100亿元。新架构将推动散落在多个业务的模型与基础设施整合,确保在同一指挥体系下协同作战,以应对激烈的AI市场竞争,并为未来五年设定了AI基建投入远远超过3800亿元的目标,以及云和AI商业化年度收入突破1000亿美元的宏伟目标。

人工智能领域正经历一场“实战化”变革。近日,腾讯与京东宣布深度合作,双方将围绕AI Agent(智能体)展开联合布局,旨在推动AI Agent从“会说话的助手”向“能办事的管家”进化,标志着国内AI应用正式迈入了“交易闭环验证期”。
此次合作充分利用了腾讯的用户入口、成熟支付系统和小程序生态,以及京东强大的商品池、高效供应链和零售履约能力。双方的结合,意在打通从需求沟通到下单履约的全链路,使AI真正具备介入实物交易的核心能力。行业专家指出,目前AI应用的评价标准正从单纯的技术能力(如模型参数、算法强度)转向“商业兑现”,即AI能否产生实际交易价值。
对腾讯而言,此次合作弥补了其在实物电商交易环节的短板,开辟了新的流量变现路径。对京东而言,通过AI Agent触达用户,有望获得更低成本的订单来源,并因智能化转型提升企业估值弹性。如果该模式能够跑通,AI Agent有望成为下一代互联网的“交易入口”,彻底改变消费者的网购习惯,为AI在零售领域的深度扎根提供极具参考价值的样本。
人工智能安全领域的布局正在提速。据知名科技记者Alex Heath透露,Anthropic有望正式发布其网络安全模型Mythos的公开版本,此版本将以“Fable5”为名推出,并嵌入更为严格的安全防护措施以适应公开环境。Anthropic曾于今年4月首次推出Mythos,当时其访问权限仅限于经过严格审核的特定机构。
此次面向公众市场的发布,意味着该模型将进入更广泛的应用阶段。相较于此前专供“玻璃之翼”(Project Glasswing)合作伙伴的内部版本,即将亮相的公开版Mythos在网络操作权限上会有所受限,以有效规避潜在的滥用风险。尽管在权限上做了针对性平衡,但Mythos公开版在性能表现上依然强劲,重点优化了长周期、多步骤任务的处理能力。这种对复杂工作流程的高效执行力,将使其在应对网络威胁检测、安全审计等需要深度逻辑分析的场景中,表现得更加游刃有余。
此次发布不仅是Anthropic丰富其安全AI产品线的关键举措,也体现了公司在推动AI技术向更高安全标准演进方面的决心。随着Mythos的正式走向市场,企业级用户在面对日益严峻的网络安全环境时,将迎来一位更具实操能力的智能化助手。
OpenAI近期密集释放多项重磅动作,标志着其加速盈利、推进IPO的明确目标。公司已完成资本重组并简化企业架构,非营利机构“OpenAI基金会”现已正式更名为母公司,并持有营利主体的股权,未来收益将全部用于支撑公益事业。其核心使命是确保通用人工智能造福全人类,聚焦健康与疾病攻克以及AI韧性技术解决方案两大方向。
在产品层面,OpenAI开启了大刀阔斧的改革,计划在未来数周推出全面改版的ChatGPT,将其正式转型为整合编码工具、全场景AI智能体的“超级应用”,覆盖个人生活与职场办公全领域。为集中算力、研发与资金资源,OpenAI明确放弃视频生成工具Sora等“支线项目”,将核心资源投入到打造专属个人智能体上。公司内部直言“单纯的对话聊天时代已经落幕”,ChatGPT将彻底跳出传统聊天机器人的定位,转型为一站式AI流量与服务入口。
在安全方面,OpenAI于6月6日正式推出“锁定模式”(Lockdown Mode),专门抵御行业高发的提示注入攻击,防范敏感数据泄露风险,主要服务于处理涉密信息的企业和机构。此举旨在补齐B端市场短板,打消企业客户与资本市场的风险顾虑,为商业版图扩张扫清障碍。OpenAI正力求在资本诉求、初心使命、产品创新与安全风险之间找到最优解,其商业化能力和盈利速度将接受市场检验。

彭博社记者马克 · 古尔曼撰文指出,苹果在全球开发者大会(WWDC26)上为新一代产品铺路,试图证明其在经历多年AI功能延期和落地不顺之后,仍有能力在AI时代参与竞争。IDC分析师弗朗西斯科 · 杰罗尼莫在报告中提到,“WWDC26是苹果的AI可信度测试。苹果需要让AI在整个生态系统中变得可信、有用,而且无处不在却不打扰用户。”
苹果最新一代操作系统的核心是经过全面改造的Siri AI,覆盖iOS 27、macOS 27 Golden Gate、watchOS 27和visionOS 27。Siri AI被设计得更智能、更可靠,可以理解上下文,并能更精准地控制多种应用。然而,发布会期间,苹果股价下跌1.9%,反映了投资者对其AI战略的怀疑。苹果也承认,新功能不会一次性全面铺开。Siri AI初期只支持英语,今年秋季推出时仍将标注为测试版,中国和欧盟用户最初也无法使用最新AI功能。
古尔曼表示,发布会不仅是在展示未来,也是在弥补过去的短板。通过重建Siri、升级AI技术,苹果正在为未来一批更依赖AI能力的产品打基础。IDC分析师纳比拉 · 波帕尔认为,这些功能将成为推动iPhone 14及更早机型用户升级的巨大催化剂,尤其是在智能手机市场走弱的背景下,这将帮助苹果维持当前势头。
6月9日,谷歌正式为旗下AI研究与笔记工具NotebookLM推送重大升级。该工具的底层模型已原生切换至Gemini 3.5,并深度接入智能体Antigravity,标志着NotebookLM从早期的“文档阅读与内容整理工具”演进为具备全栈生产力的AI研究助理。
此次升级最核心的突破在于引入了安全的云端计算环境,使NotebookLM能够在笔记本内直接编写并运行代码、深度分析数据并实时生成图表。过去,市场分析、学术研究等用户在完成数据清洗、趋势分析和可视化时,通常需要在多个软件间频繁切换;而新版工具实现了全流程的闭环操作,支持直接输出PNG、SVG图表,以及PDF、Markdown、Excel表格和PowerPoint幻灯片等十余种主流格式文件。
从战略布局来看,谷歌目前采取了分级付费的准入策略,新功能首批仅向AI Ultra订阅用户及部分企业级Workspace客户开放。尽管谷歌内部评估显示,新版系统在大文档分析、高级网页研究等核心维度上的平均胜率超过65%,但其高阶能力的商业化试水,反映出科技巨头正在加速将“轻量级免费工具”转化为资产化、高壁垒的付费办公入口。这一动作不仅是对用户付费意愿的试探,也预示着AI应用层正从“问答式轻交互”向“重流程式端到端生产”深度演进。
据路透社报道,欧盟委员会发言人托马斯 · 雷尼耶表示,苹果在申请豁免Siri AI互操作性义务未果后,决定不在欧盟推出新的Siri AI工具。欧盟委员会对此回应称,“不在欧盟推出Siri AI,是苹果自己的决定,也完全只是苹果自己的决定。苹果只是没能开发出符合欧盟基本隐私和安全标准的互操作性方案。而且,苹果没有尝试寻找合适的合规方案,而只是要求欧盟委员会豁免苹果的互操作性义务。这种做法不可行。”此事件进一步凸显了科技巨头在欧盟市场推出新AI产品时,所面临的严格监管和合规挑战。
夜雨聆风