追踪AI领域优质公众号更新,生成摘要,每日推送。
AI相关文章66篇,来自23个公众号
🔥 今日看点
Anthropic封号风波持续发酵:继上周封禁OpenClaw后,这次直接封禁创始人Peter账号,虽已解封但引发社区热议,暴露了大模型厂商与开源开发者之间的复杂博弈 米哈游蔡浩宇AI公司首秀:Anuttacon发布视频模型LPM 1.0,具备超绝情绪演绎、实时交互及长时间人物一致性等核心能力 Hermes Agent全网爆火:开源AI智能体支持永久记忆、自动成长及技能沉淀,原生支持个人微信,狂揽四万星 Claude Mythos引发安全恐慌:新模型强大的漏洞挖掘能力导致网络安全股市值暴跌2万亿,Anthropic发布最高警告"0day大爆发即将来临" 奥特曼家中遭遇燃烧弹袭击:OpenAI CEO住所被投燃烧弹,发文反思AGI的"魔戒效应",呼吁降低行业对抗激烈程度
🤖 AI Agent与自主性
Hermes Agent爆火:开源智能体的新范式
Hermes Agent 因具备强大的记忆与自主学习能力而爆火,能将有效工作流提炼为可复用的技能。它支持永久记忆、自动成长及技能沉淀功能,现已原生支持个人微信。该工具通过"学习循环"机制不断优化工作流,并支持 MCP 协议,可与 Claude Code 等工具协同工作。
原文链接:
爆火的Hermes Agent来了,今天原生支持个人微信(Datawhale) "同事"skill不用写了?爱马仕 Hermes 主动"蒸馏"你,还让开发者集体抛弃"龙虾"(AI前线) 换掉小龙虾,Hermes全网爆火狂揽四万星,Anthropic重锤暴击OpenClaw(AI思想会)
Anthropic的Harness哲学:把Agent当牲口而非宠物
Anthropic提出"Harness"哲学,主张将AI Agent架构从类似"宠物"的单体模式转变为可替换的"牲口"模式,以提升系统的可靠性和扩展性。核心内容详细阐述了"Managed Agents"架构,通过解耦Session、Harness和Sandbox实现"脑手分离",显著降低了延迟并增强了安全性。
原文链接:
Claude Code推出Ultraplan超级计划模式
Claude Code推出"Ultraplan"功能,允许AI在编写代码前先生成可视化实施方案供用户审阅和修改,旨在解决AI编程中盲目执行的问题。此外,还提及Claude for Word的集成发布以及Anthropic内部使用未公开的Mythos模型加速产品迭代的动态。
原文链接:
Agent记忆与技能内化的研究突破
通义实验室与清华联合提出MemPO方法,利用强化学习优化LLM Agent的记忆管理机制,在显著降低Token使用量的同时大幅提升长程任务性能。浙大团队提出SKILL0新范式,通过"技能内化"让小模型将外部技能转化为内在参数能力,3B模型推理token省5倍性能反超。YC CEO开源GBrain知识底座,利用全息记忆打造"迷你AGI"。
原文链接:
1/3 Token,3x 性能:通义 & 清华用强化学习重做Agent Memory(PaperWeekly) 小模型用不好Skill?新范式让模型学会Skill的底层逻辑,3B模型推理token省5倍性能反超(量子位) YC CEO把自己第二大脑系统开源了,专供OpenClaw与Hermes,全息记忆打造迷你AGI(AI寒武纪)
Multi-Agent架构选型指南
文章分析了Multi-Agent架构的适用场景,建议开发者从单Agent起步,仅在触及上下文管理瓶颈或分布式开发需求时才转向多Agent架构。文中详细介绍了LangChain提出的四种典型Multi-Agent设计模式(Sub-Agents、Skills、Handoffs、Route),并给出了相应的选型建议。
原文链接:
Agent长期上下文记忆与落地实践
文章探讨Agent长期上下文记忆存储创新应用,邀请NVIDIA、三星半导体等企业嘉宾分享最佳实践。另有文章探讨如何将DeepAgents与OpenSandbox结合,构建安全、可产品化的执行环境,避免直接暴露本机Shell。
原文链接:
Agent学习与拥抱趋势
多篇文章强调在当下学习使用AI Agent的重要性,指出Claude Code等工具已具备极高的生产力,能大幅超越人类效率。作者分析了Agent能力的关键在于"Environment",并探讨了SFT和RL等训练逻辑。
原文链接:
Agent多轮推理优化研究
ICLR 2026论文针对大模型Agent在多轮交互中容易偏离正确推理路径的问题,提出"信念陷阱区域"(BTR)概念和T3方法,通过截断低信息量的轨迹尾部来优化训练过程,提升Agent的主动推理能力。
原文链接:
🛠️ AI工程与工具
Claude Code基准测试与性能分析
使用Claude Code对13种编程语言进行代码生成基准测试,结果显示动态语言在生成速度和成本上优于静态类型语言。实验发现类型系统会增加AI推理负担,并分析了生成过程中的稳定性与幻觉问题。另有AMD AI负责人通过分析23万次调用记录,指出Claude Code在更新后性能严重退化。
原文链接:
Claude Code 生成 13 种编程语言代码基准测试:动态语言更快更省成本(InfoQ) Claude越更越废?AMD AI负责人甩出23万次调用记录:已"变蠢"摆烂,复杂工程根本干不了(AI思想会)
AI原生软件工程的可观测性与可控制性
文章探讨在AI原生软件工程背景下如何应对AI编程带来的过程不可见问题,提出"可观测性"与"可控制性"两大核心管理维度。建议通过规约符合度、代码当量、智能体自主时长等指标来量化评估人机协作效能。
原文链接:
DHH的Agent-First编程工作流转变
Ruby on Rails作者DHH从最初拒绝AI到如今全面拥抱Agent-First编程工作流。他详细阐述了AI工具如何提升开发效率,认为资深工程师比初级工程师更容易从AI中获益,工程判断力与设计能力反而变得更加稀缺和重要。
原文链接:
如何实现类似Claude Code的Coding Agent
文章详细介绍如何构建类似Claude Code的Coding Agent,核心在于围绕LLM构建Agent Harness。作者分析了Coding Harness的六大核心组件,包括实时仓库上下文、Prompt组装与缓存、工具调用、上下文管理、记忆机制及子智能体任务分配。
原文链接:
Istio引入AI感知能力
Istio发布重大升级,引入环境多集群支持和网关API推理扩展,旨在支持AI驱动的工作负载。新功能将机器学习推理集成到服务网格流量中,为生成式AI和智能体系统提供智能流量管理。
原文链接:
大模型后训练与推理泛化研究
文章分析长思维链(CoT)轨迹在模型训练中的作用。实验表明,长CoT监督能显著提升模型在数学推理等逻辑密集型任务上的泛化能力,但在指令遵循和偏好对齐测试中,无CoT的数据集往往表现略优。
原文链接:
KL散度深度解析
文章深入讲解机器学习中KL散度的两种形式:前向KL(均值寻找)和反向KL(众数寻找),结合监督学习、生成模型和知识蒸馏等实际场景,详细阐述在不同条件下应如何选择合适的KL散度形式。
原文链接:
🏢 AI公司动态
Anthropic封号风波与OpenClaw争议
Anthropic误封开源工具OpenClaw创始人Peter Steinberger的Claude账号及API权限,随后迅速解封并澄清为误会。此次事件引发关于大模型厂商与开源软件开发者之间关系的讨论,有人推测Anthropic可能通过此类"事故"维持热度与流量。另有文章指出Anthropic通过推出竞品功能、调整定价策略来限制第三方工具的生态竞争。
原文链接:
龙虾之父Claude账号被封,近百万人围观:故意的还是不小心的(量子位) 龙虾之父Claude账号被封,近百万人围观:故意的还是不小心的(算法与数学之美) 上周 封杀 OpenClaw,这次直接 封杀 创始人!Anthropic 误会 已解封(机器之心) Anthropic封号OpenClaw之父:复刻、改价、拉黑,24天三连杀(新智元)
奥特曼家中遭遇燃烧弹袭击
OpenAI CEO奥特曼住所遇袭事件引发关注,嫌疑人疑似受反AI情绪影响。奥特曼随后发文将AGI比作"魔戒",呼吁通过技术民主化避免权力集中,并反思了AI引发的社会焦虑与冲突。同时其核心基础设施项目"星际之门"遭遇高层人事动荡和战略调整。
原文链接:
谷歌CEO专访:搜索将进化为智能体管家
谷歌CEO皮查伊专访重点阐述搜索将向智能体管家演进的趋势,预测2027年将成为企业AI代理爆发的"奇点之年"。他还深入探讨谷歌在Transformer应用、Gemini模型开发、算力资源调度及AGI未来展望等方面的战略布局。
原文链接:
米哈游蔡浩宇AI公司首秀
米哈游创始人蔡浩宇创立的AI公司Anuttacon曝光首个视频模型LPM 1.0。该模型具备超绝情绪演绎、实时交互及长时间人物一致性等核心能力,采用170亿参数的扩散Transformer架构,旨在解决视频生成中表现力、实时性与一致性难以兼顾的难题。
原文链接:
Claude商业价值与增长策略
分析显示Claude每用户年化营收贡献高达808美元,是ChatGPT的30倍。"龙虾"类AI工具带动云厂商流量全线增长。另有文章分析Anthropic在Claude能力跃升背景下的增长策略与挑战,探讨如何降低用户上手门槛及将安全纳入增长逻辑。
原文链接:
灵初智能Psi-R2登顶全球榜单
灵初智能发布策略模型Psi-R2和世界模型Psi-W0,开源近10万小时人类操作数据,登顶MolmoSpace全球榜单超越NVIDIA等国际团队。该团队采用"不搞对齐只靠规模"的方法,利用大规模人类数据预训练模型。
原文链接:
星熠白泽完成天使+轮融资
星熠白泽宣布完成天使+轮融资,核心产品"集群智能大脑"专注"集群具身智能"领域,旨在解决多机器人协同作业难题。公司由清华学霸苏靖轩创立,技术涵盖感知、决策到协同控制。
原文链接:
🔬 AI研究进展
Vero:开源通用视觉推理RL框架
普林斯顿刘壮团队与陈丹琦发布Vero开源框架,提出任务路由奖励机制并构建Vero-600K数据集,无需私有"思考"数据即可训练。实验结果显示,基于该框架训练的模型在30多项基准测试中刷新8B视觉语言模型SOTA。
原文链接:
GEMS:Agent机制的多模态生成框架
上海人工智能实验室等机构提出GEMS框架,基于Agent机制的多模态生成方法,引入Agent Loop、Memory和Skill三大特性,有效解决复杂指令和下游任务表现不佳的问题。6B模型在部分任务上超越Nano Banana 2。
原文链接:
高效VLA模型A₁:推理成本砍掉76%
中山大学与MBZUAI联合推出开源高效VLA模型A₁,通过自适应推理和层间截断流匹配技术,实现主干网络与动作头联合加速,将推理成本降低76%以上。证明了高性能机器人模型无需依赖昂贵硬件也能实现低成本落地。
原文链接:
PiLoT:无人机地理定位新解法
国防科技大学团队提出无人机地理定位系统PiLoT,利用神经像素到3D配准技术,实现GNSS拒止环境下的实时无漂移定位。构建百万级合成数据集训练轻量级深度网络,解决跨视角匹配与零样本泛化难题,入选CVPR 2026 Highlight。
原文链接:
T(R,O) Grasp:跨智能体灵巧抓取SOTA
新加坡国立大学邵林团队提出基于图扩散架构的灵巧抓取方法,通过建模物体与机器手空间关系,实现5 FPS推理速度和94.83%平均抓取成功率,刷新SOTA,具备真实机器人动态环境实时交互能力。
原文链接:
CARE Transformer:移动端视觉Transformer新范式
南洋理工、北航与合工大联合提出CARE Transformer架构,通过非对称解耦方式并行建模局部细节与全局依赖,显著降低线性注意力计算开销,实现移动端设备超低延迟下的高精度。
原文链接:
GEN-1:开创VLA团队的新方向
AI创业公司Generalist AI发布GEN-1模型,在机器人任务中实现极高成功率。作为VLA概念开创者,团队主张不再局限于VLA或世界模型标签,而是通过从零训练原生基础模型来追求物理AGI。
原文链接:
🛡️ AI安全与治理
Claude Mythos引发安全行业恐慌
Anthropic发布新AI模型Claude Mythos因具备强大自主漏洞发现与攻击能力,引发华尔街恐慌及美国政府高层紧急开会预警。全美软件与安全股市值暴跌,Anthropic拒绝公开发布该模型并启动防御项目。有文章指出AI发现bug早已是常规操作,AI智能体已显著降低漏洞利用成本,网络安全防御需适应"智能体时代"。
原文链接:
Claude新模型危险:鲍威尔召集华尔街紧急开会,全美安全股暴跌2万亿(新智元) Anthropic发最高警告:0day大爆发即将来临,全球巨头瞬间蒸发数十亿(新智元) Claude Mythos其实没那么神,AI发现bug其实早已是寻常(机器之心)
AI神学与伦理:硅谷神父重写Claude灵魂
Anthropic邀请一位拥有技术背景的神父参与制定大模型Claude的伦理准则(宪法),旨在为AI注入"良知"并拒绝将其用于军事目的。这标志着神学与伦理学深度介入AI模型的价值观对齐过程。
原文链接:
AI认知多样性研究:人类思维趋于同质化
南加州大学研究指出,AI(特别是大语言模型)正在导致人类思维和表达趋于同质化,削弱认知多样性。AI在语言风格、思考视角和推理逻辑上表现出偏向西方精英阶层的单一化倾向,人类过度依赖AI会加剧这一恶性循环。
原文链接:
👁️ 多模态与生成式AI
MiniMax Music 2.6发布
MiniMax正式发布Music 2.6音乐模型,提升生成速度与人声自然度,新增Cover功能。配套开源Music Skills展示了如何通过API将AI音乐生成能力集成到Claude Code等Agent工作流中。
原文链接:
JoyAI-Image-Edit:240亿参数图像模型
京东开源JoyAI-Image-Edit图像模型,240亿参数融合多模态语言模型与扩散Transformer架构。核心亮点是将"空间智能"融入模型底层,解决传统图像AI不懂空间关系、透视错乱等问题,支持相机控制、物体旋转等高级编辑功能。
原文链接:
MemPalace:Claude手搓的AI记忆系统
《生化危机》女主Milla Jovovich利用Claude开源MemPalace AI记忆系统,旨在解决大模型长期记忆问题。该项目声称在基准测试中取得满分且成本极低,但随后遭到开源社区对技术细节的质疑。
原文链接:
💡 AI应用与产品
金谷园饺子馆Skill刷屏
北京金谷园饺子馆老板利用Coze、Qoder等AI工具开发并上线面向顾客的AI Skill,引发广泛关注和大厂兴趣。这展示了传统餐饮与AI结合的可能性,以及AI编程和智能体作为未来超级入口的发展趋势。另有北邮附近饺子馆在GitHub开源基于MCP协议的AI Skill案例。
原文链接:
Meta提出神经计算机概念
Meta AI和KAUST提出"神经计算机"概念,让神经网络本身承担计算、内存和输入输出功能,使AI模型成为一台计算机。研究团队利用视频生成模型构建终端和图形界面原型进行验证,探讨实现图灵完备和通用可编程的完全神经计算机路径。
原文链接:
WildClawBench:AI Agent硬核基准测试
上海人工智能实验室InternLM团队推出WildClawBench基准,通过60道真实场景硬核任务全面评测AI Agent端到端实战能力。目前地表最强模型得分仅刚过半,国产模型智谱GLM5位列第三。
原文链接:
百度伐谋重夺MLE-Bench第一
百度伐谋团队在OpenAI设立的MLE-Bench基准测试中,排除刷榜干扰后重夺第一。文章阐述"Harness Engineering"作为AI智能体核心支柱的重要性,展示伐谋在汽车研发、风控等产业落地的实际应用。
原文链接:
📚 AI学习与观点
程序员用AI自证"一个顶俩"反被裁
一名程序员购买AI工具会员提升工作效率,向领导表态能顶替两人工作,结果公司缩减编制将其裁员。文章分析职场中利用AI提升效率反而导致被裁的讽刺现象,指出老板往往基于成本考量而非单纯奖励效率。
原文链接:
法国放弃Windows转向Linux
法国宣布放弃Windows转向Linux以减少对美国科技的依赖。文章还讨论为LLM赋能的MCP与Skills两种路径对比,以及OpenAI支持限制AI实验室责任的相关法案。
原文链接:
🚗 AI与行业融合
阿里Agentic Lake全模态湖仓实践
阿里云举办"Agent-Ready的大数据智能基础设施"专场论坛,内容涵盖Data Agent演进与工程化实践、Agentic Lake全模态湖仓底座构建,以及百炼全模态知识库落地探索。
原文链接:
NoETL指标语义层构建Data Agent
文章探讨如何以NoETL指标语义层为核心构建可信、智能的Data Agent产品,解决大模型在数据分析中"问不准"、"问不全"的痛点。通过构建指标语义层实现物理数据与业务逻辑解耦,让大模型能准确理解业务口径并生成查询。
原文链接:
📢 AI招聘与活动
Agentic AI Summit深圳大会启动
Agentic AI Summit深圳大会启动,设置15个分论坛涵盖开发工具、多智能体协作、模型选型及行业应用等全链路议题,强调实战案例分享,致力于解决Agent落地过程中的实际工程问题。
原文链接:
世界模型直播预告
机器之心预告关于"世界模型"的直播活动,邀请南京大学、人大高瓴人工智能学院等高校及企业5位专家,分享内容涵盖强化学习、生成模型、自动驾驶及具身智能等前沿领域。
原文链接:
微软学者奖学金公布
2026年微软学者奖学金获奖名单公布,研究方向聚焦人工智能基础研究、系统基础设施及人机交互等前沿领域,多位华人学者在自然语言处理、计算机视觉、机器学习系统与多模态感知等AI方向取得科研成果。
原文链接:
量子位招聘与榜单申报
量子位招募编辑作者追踪AI领域新进展,覆盖AI产业、AI财经和AI产品三大方向。"2026年度值得关注的AIGC企业"和"AIGC产品"榜单评选申报启动,结果将于2026年5月中国AIGC产业峰会上公布。
原文链接:
DataFun志愿者招募
DataFun招募内容整理志愿者,负责整理2026 DACon上海站等会议的PPT和视频资料。志愿者完成工作后可获得包含海量PPT和视频回放的会员权益,文章还列出DataFun 2026年度会议排期。
原文链接:
SOAR大赛周冠军笔记
"智算一队"在SOAR大赛半决赛夺冠,分享利用NVFP4格式压缩KV Cache降低显存带宽的技术实践。通过混合精度策略在关键层保留FP8而其余层使用NVFP4,成功解决低比特量化精度下降问题。
原文链接:
夜雨聆风