Agent 基础设施化
世界模型理论验证。
Agent 与多智能体
Orchard 统一框架:微软开源,统一代码、GUI、助手三类 Agent 训练管线,定义标准动作空间。
Agent 老化与测试:研究指出 Agent 长期运行会性能衰退,并提出针对环境损坏的鲁棒性评测。
自组织科研:AutoScientists 实现假设-实验-验证全自主闭环,失败驱动自我修正。
推理与思维链
隐式思维链:Transformer 被证明可内化推理步骤,无需输出中间 token,显著降低推理成本。
可恢复推理:REPOT 引入检查点机制,推理出错可从中间状态恢复,避免长任务重跑。
自我改进验证器:STV 模型在部署后利用反馈持续优化,提升数学与代码推理的在线学习能力。
世界模型与多模态
LeCun 理论支撑:LeJEPA 数学证明 AI 可学习真实物理结构,世界模型从“复现”转向“理解”。
解决“复印机”问题:多伦多大学与 Adobe 提出 DLA 模块,让 AI 真正理解参考图语义而非机械复制。
效率提升:阿里与南大提出 DAR 方法,图像生成训练速度提升近 9 倍。
产业与融资
Anthropic 近万亿估值:完成 650 亿美元 H 轮融资,投后估值约 9650 亿美元,存储三巨头参投。
Cerebras 上市:AI 芯片公司登陆纳斯达克,市值 670 亿美元,创行业 IPO 纪录。
国内政策规范:发布 AI 终端智能化分级国标,明确智能体与开源芯片/OS的协同发展路径。
技术迭代与算力竞赛
底层技术的演进与算力基础设施的建设正在同步加速:模型降价与开源:高性价比成为中国模型的新卖点。
前沿技术趋势:智源研究院指出,“世界模型”正成为AGI共识方向,AI开始尝试理解并预测物理世界的运动规律。商汤科技发布了原生理解生成统一模型SenseNova U1。
算力投入激增:为支撑指数级增长的应用需求,各大厂商大幅增加算力预算。
字节跳动今年AI基础设施支出计划上调至超2000亿元;Anthropic承诺未来五年内向谷歌云支付约2000亿美元用于云算力支出。
具身智能与机器人:特斯拉确认Optimus人形机器人量产线落户上海,目标年产10万台。
随着AI的普及,多国政府正在加快立法与监管步伐,为行业发展划定红线
注:个人的思考,不构成投资建议。如果你从中得到了什么启发,那是你自己的努力。
夜雨聆风