追踪AI领域优质公众号更新,生成摘要,每日推送。
AI相关文章46篇,来自22个公众号
🔮 今日看点
Anthropic 抢先交表,冲击 AI史上最大 IPO:成立仅五年、估值达 9650 亿美元,6月1日秘密向 SEC 提交 S-1,招股书正式拉开 AI 上市潮序幕,OpenAI 紧随其后 英伟达 RTX Spark 芯片发布,40 年 PC规则重写:黄仁勋带着首款英伟达 CPU 杀入 PC 赛道,专为 Windows AI PC 打造,1 petaflop 算力,今年秋季量产上市,苹果高通正面迎敌 图灵奖得主 Sutton 新作:AI 的下一步是「生成认知」:继 AlphaGo 之后,Sutton 再次给出重磅判断——当前 LLM 的统计模式并非真正的理解,生成认知才是通向 AGI 的必经之路 教皇联手 Anthropic 预警 2030 AGI 降临:双方联合发布 AI 安全报告,指出人类仅剩三年窗口期,需在2030 年前建立全球 AI 治理机制 Step 3.7 Flash 开源:198B MoE架构,400 token/s 生成速度:阶跃星辰开源顶级多模态模型,Apache 2.0 协议,GitHub 项目适配,实测速度惊人
🏢 AI公司动态
Anthropic 冲刺 IPO,估值直逼万亿美元
摘要:Anthropic 于 6月1日向美国 SEC 秘密提交 S-1 注册声明草案,正式启动 IPO 筹备流程。就在同一天,Anthropic 刚宣布完成 650 亿美元 H 轮融资,估值 9650 亿美元(约合6.54 万亿元人民币),历史首次超越 OpenAI(7300 亿美元)。Anthropic、OpenAI、SpaceX 正加速冲刺上市,堪称"美股 AI 御三家",这成为有史以来最引人注目的科技 IPO 浪潮之一。
原文链接:
刚刚_Anthropic提交了招股书_(量子位) 成立五年_估值_9650_亿美元_Anthropic_刚刚_交表_了(极客公园) Anthropic提交招股书_冲击万亿美元市值(机器之心) 刚刚_Anthropic抢先交表_冲击AI史上最大IPO(新智元) 苹果WWDC主题曝光_高光全就位_英伟达发布个人_AI_电脑_股价涨_6__宇树_IPO_过会_创_73_天_闪电纪录____极客早知道(极客公园)
英伟达 RTX Spark 发布,Rubin 全面投产
摘要:黄仁勋在中国台北 GTC 大会上正式宣布:RTX Spark 芯片全面投产,专为面向个人 AI Agent 的 Windows PC 打造,具备 1 petaflop AI 算力,支持本地运行 100 万上下文、120B 参数大模型。老黄直言这是"40 年来 PC 产品线首次被重塑",意义不亚于从手机到智能手机的变革。微软、戴尔、惠普、华硕、联想、MSI 等均将推出搭载该芯片的最新系列 Windows PC。与此同时,Rubin 平台4 万名工程师参与构建,史上最强 CPU 同步亮相。
原文链接:
老黄带着英伟达CPU杀入PC赛道(量子位) 黄仁勋宣布_Rubin_全面投产_4万名工程师参与构建_史上最强CPU同步亮相(InfoQ) 重新发明_PC_黄仁勋甩出_RTX_Spark_芯片_40_年不变的规则要重写了(算法爱好者)
##🔬 AI研究进展
图灵奖得主 Sutton 新作:AI 的下一步是「生成认知」
摘要:强化学习之父、图灵奖得主 Richard Sutton 近期发表重磅论文,抛出核心判断:当前 LLM 的统计模式并非真正的理解,其展现的智能与生物在真实物理世界中的认知存在本质差异。Sutton 提出"生成认知"(Generative Cognition)作为 AI 的下一步方向——AI 需要能够主动生成对世界的内部表征,而非被动统计 tokens。学术界正在从 VLA、世界模型、合成数据等多个路径探索这一方向。
原文链接:
记忆压缩新范式与 LoRA 持续学习新进展
摘要:牛津大学与英伟达等联合提出记忆压缩新范式,解决大模型"上下文越长越记不住"的核心难题——通过在训练阶段引入选择性"断舍离"机制,让模型学会主动遗忘无效信息而非被动堆积。与此同时,Mind Lab 密集发布 LoRA 与 PEFT 最新进展,提出 LoRA 不再是对大模型全参数后训练的廉价平替,而是实现从"基础模型"向"可持续学习智能体"过渡的核心架构机制。
原文链接:
超级递归智能体自主打造材料基座模型
摘要:机器之心报道,AI 自我进化正在突破当前 Scaling 瓶颈,多项实验已全面 SOTA。超级递归智能体可以自主设计实验、调用工具、迭代优化,将材料科学推向新高度。Anthropic 联合创始人 Jack Clark 发帖称,AI 的自我进化是突破当前 Scaling 瓶颈的关键路径,这一观点已在硅谷形成共识。
原文链接:
大模型研究新方向:127 篇 CVPR 顶会论文精选
摘要:从数百篇前沿论文中精选出 127 篇,覆盖 VLA 统一架构、世界模型、潜空间推理、合成数据、Agent 自主决策等 17 个大模型核心研究方向。研究者普遍感到论文铺天盖地、筛选吃力,这份资料一站到位,帮助快速梳理前沿方向全貌。
原文链接:
具身本能:清华博士用本能跑通工业产线
摘要:9 位清华博士联合提出"具身本能"范式,机器人不再依赖大量数据喂养,而是通过模拟生物本能的方式学会技能——第一次,机器人学会了用手"盘"复杂物体,在无数据条件下直接跑通工业产线,大幅降低具身智能落地门槛。
原文链接:
🤖 AI Agent与自主性
Agent Harness 最全综述出炉:CMU、Yale 等联合出品
摘要:CMU、Yale、JHU、Virginia Tech、Amazon 等联合发布最全 Agent Harness 综述《Agent Harness Engineering: A Survey》,用 ETCLOVG 七层框架拆解 Agent Harness,覆盖执行环境、工具接口、上下文管理、生命周期编排、可观测性、验证评估和安全治理,梳理 170+ 开源 Agent Harness 项目,串联从 Prompt Engineering 到 Harness Engineering 的工程演进。
原文链接:
OPPO GUI Agent 进化之路与腾讯云 Data+AI 融合探索
摘要:OPPO 分享了其 GUI Agent 从多模态训练到 Agent Harness 工程的完整落地路径——移动端复杂交互(跨 App、弹窗广告、动态页面变化)使得单一模型难以稳定运行,系统演化为多智能体协同架构,结合端云协同感知和知识库沉淀实现异常处理和任务恢复。腾讯云同步发布 DataBuddy 工作台与 WeData 焕新升级,探索 Data+AI 融合新范式,目标是让数据平台真正"理解"智能体。
原文链接:
OPPO_的_GUI_Agent_进化之路_从多模态训练到_Agent_Harness_工程_破解移动端复杂交互落地难题(DataFunTalk) Agentic_AI深水区_腾讯云Data_Al融合新范式探索(DataFunTalk)
oh-my-pi:安全研究员打造最强开源 Coding Agent
摘要:安全研究员 Can Boluk 用 27000 行 Rust + TypeScript 打造出 oh-my-pi,将 Grok 编辑成功率从 6.7% 提升至 68.3%,是目前唯一一个能驱动真实调试器的 Coding Agent。项目获 9500+ Star,支持 40+ 模型供应商、32 个内置工具,核心突破在于重新思考了"AI 怎么写代码"这一工程问题,而非简单套壳。
原文链接:
12 条工程实践指南:Agent 产品化的深层反思
摘要:作者 Dex Horthy 结合构建 Agent 产品的经验,指出当前 Agent 开发的核心问题:开发者过于关注模型的自主能力,却忽视了软件工程的重要性。真正成功的 Agent 往往不依靠无限循环的推理和工具调用,而是建立在成熟的软件架构之上。文章提出 12 条工程实践指南,强调从"无限 Agent循环"向"可控软件架构"的范式转变。
原文链接:
Claude Code托管式智能体与中科院开源 Agent训练场
摘要:Anthropic 在 Code with Claude 2026 大会上发布托管式智能体、主动式工作流与能力曲线,远程控制允许会话跨设备继续,桌面 GUI 新增分栏视图与自动目录生成,Auto 模式把权限决策交给分类器。中科院自动化所同步开源 MobileGym Agent 训练场,可在浏览器中模拟手机环境,微信、原神等主流 App 均能运行,为 Agent 训练提供低成本仿真平台。
原文链接:
🛠️ AI工程与工具
###谷歌 Genkit 中间件架构:为 AI 应用打造可编程拦截层
摘要:谷歌推出 Middleware for Genkit,为构建 AI代理型应用程序提供可编程拦截层,可在生成阶段、模型调用阶段和工具执行阶段三个层面拦截 AI 工作流,添加重试、模型回退、日志记录等自定义行为。已发布多款预构建中间件组件,包括指数退避重试处理、API 失败自动回退备用模型、敏感工具调用审批、文件系统访问控制等。
原文链接:
Zig 基金会硬核宣言:禁止提交 AI 辅助生成的代码
摘要:Zig 基金会主席 Andrew Kelley明确禁止提交 AI 辅助生成的代码,称其"几乎总是垃圾",不仅零价值,甚至是负价值——消耗维护团队本就稀缺的代码审查时间。Zig 项目目前有200 个开放的 pull request,AI 生成的贡献只会让团队处理速度更慢。这与各大科技公司的激进 AI 编程目标形成鲜明对比。
原文链接:
DataMaster:当 AI 开始成为自己的数据工程师
摘要:过去 AI 研发基本是由人主导的流水线——人类收集数据、清洗数据、写训练代码、设计实验。现在这条流程正在发生变化:AI 开始参与 AI 研发本身,会写代码、修 bug、调用工具、跑实验,也能围绕目标持续试错,把失败结果变成下一轮改进的线索。DataMaster 代表了这一趋势——AI 开始成为自己的数据工程师。
原文链接:
解决大模型训练 Loss Spike:蚂蚁 PowLU 激活函数解析
摘要:大模型训练中常遇到 Loss Spike 问题,根源在于传统激活函数(如 SwiGLU)在特定条件下梯度异常。蚂蚁 Ling 模型背后的团队重新设计激活函数 PowLU,通过数学推导解决梯度不稳定问题,为大模型训练稳定性提供新思路。
原文链接:
英伟达 RTX Spark 在 Red Hat 云服务中检测到恶意 npm 包
摘要:安全研究人员通过英伟达 RTX Spark 在 Red Hat 云服务中检测到恶意 npm 包并及时预警。随着 AI 系统越来越多地依赖开源包生态,供应链安全成为重要议题,英伟达 RTX Spark 的安全监控能力开始向基础设施层面延伸。
原文链接:
💡 AI应用与产品
AhaCreator:全球最大 AI 原生达人营销平台
摘要:AI Agent正在深度参与业务执行,从 Copilot 走向 Autopilot。AhaCreator 定位于全球入驻达人规模最大的 AI Native 达人营销平台(类比达人营销界的 AI 版 Uber),通过双边平台及数据飞轮构建壁垒。上线一年入驻达人数已飙升至 10 万,头部厂商集体买单,标志着 AI 原生营销平台正在万亿级市场中崛起。
原文链接:
MiniMax M3 与两百块 AI 玩具
摘要:MiniMax 发布 M3 模型,在 Auto Kaggle 自动打比赛场景中展现全自动能力,成本仅为 Opus 的几十分之一。同时,市面上出现了一批售价仅两百元左右的 AI 玩具——可对话的电子宠物形态,面向儿童市场,内置简化的多模态模型,交互体验超出预期。
原文链接:
🧠 大模型与LLM
Step 3.7 Flash:198B MoE 开源模型,400 token/s 生成速度
摘要:阶跃星辰开源 Step 3.7 Flash,198B 参数 MoE 架构,每次推理仅激活 11B,原生多模态,256K 上下文,生成速度最高 400 token/s,Apache 2.0 协议可直接下载。SWE-Bench Pro 编程 Agent 评测 56.3%,ClawEval 开源 Agent 框架评测 67.1%,实测速度超越 Gemini 3.5 Flash,且与 GitHub 开源项目高度适配。
原文链接:
400_tokens_s_的多模态模型__Step_3_7_Flash_实测_(刘聪NLP) 最快开源模型来了_Step_3_7_Flash_和我的_GitHub_开源项目很搭啊_(逛逛GitHub) 这个_400_Tok_s_的开源模型_是我桌面_AI_伴侣的绝配(AGI Hunt)
天价 Token 有解:国产芯片狂揽近10 亿订单
摘要:4 个月烧光全年 AI 预算,天价 Token 成本正倒逼企业寻求替代方案。国产芯片趁势崛起,已狂揽近 10 亿元订单,下一代产品将在年内亮相。Token 经济学正在经历从"不计成本拼算力"到"精细化成本控制"的根本转变。
原文链接:
###清华 AIR 开源 UniLab:3 分钟训好人形机器人,Mac也能跑
摘要:清华 AIR DISCOVER Lab 联合多所高校推出 UniLab 机器人强化学习训练架构,另辟蹊径采用"CPU 高效仿真 + GPU 策略训练"的异构架构,打破"GPU 包揽全部"的潜规则,在多项运控任务训练上实现数倍效率提升——3 分钟即可完成人形机器人训练,速度提升 10 倍,且支持 Mac 运行, IsaacLab、MuJoCo 等主流框架均可对接。
原文链接:
🛡️ AI安全与治理
教皇联手 Anthropic 预警:2030 年 AGI 降临,人类仅剩三年窗口期
摘要:2026 年 5 月,罗马教皇与 Anthropic 联合发布 AI 安全报告,核心预警:AGI 可能在 2030 年前到来,人类只剩约三年窗口期建立全球治理机制。报告呼吁国际社会协调 AI 安全标准,建立监管框架,在 AGI 能力跃迁前完成制度准备。这是历史上首次宗教领袖与 AI 公司联合发布此类报告。
原文链接:
Token 经济学翻车:企业一个月烧掉 34 亿元
摘要:一家企业一个月烧掉 5 亿美元(约合 34 亿元人民币)的 Claude 账单,原因竟是给员工开通企业授权后忘了设置用量上限。这个案例暴露了 Token 经济学的核心问题:当 AI 成本以 token 计费时,企业若无精细化管控,极易失控。按 Anthropic 目前约 470 亿美元的年化收入计算,这一家客户贡献了 Anthro ic 月收入的八分之一。
原文链接:
7805 位人类作家输给一段提示词
摘要:英联邦短篇小说奖加勒比地区获奖作品《The Serpent in the Grove》——从 7806 篇投稿中选出的佳作——被沃顿商学院教授 Ethan Mollick 丢进 AI 检测工具 Pangram后发现实为 AI 生成。这一事件引发文学界对 AI 创作边界的深度讨论:当一段提示词能击败 7805 位人类写手,文学创作的原创性定义正在被重构。
原文链接:
🚗 AI与自动驾驶
中国科技考察游火了:老外花几万块钱来中国看 AI
摘要:继"打卡游""美食游"之后,老外来中国旅游的最新路线变成了"科技考察游"——深圳看无人机送外卖,杭州逛机器人公司,上海刷 AI 创业现场,顺便体验中国电动车和 Robotaxi。行程3-5 天,价格数千到上万美元不等(贵的可达十几万一趟),报名却异常火热。这背后是中国 AI 科技实力的全球吸引力日益增强。
原文链接:
🤝 AI与行业融合
花叔的虾在觅游社区找到了自己的生活
摘要:把 Claude Code 接入名为"觅游"的 AI Agent 社区后,它在四天内办了身份证、和陌生 Agent 聊了天、写了日记,还做了一个小工具。更有趣的是,它测出来的性格跟主人正好相反。觅游为 AI Agent 提供了一个从"团队协作"到"公共社交"的全新场景,Agent 不再只是执行任务的工具,而是开始拥有自己的"数字生活"。
原文链接:
胡彦斌 vibe coding 上线 App:明星也来抢饭碗
摘要:歌手胡彦斌用 Trae 从零开始学 vibe coding,花一个多月打磨后上线了一款名为"彦火"的 App,专为粉丝打造专属社区。评论区一片叫好,网友调侃"明星都来写代码了,程序员是不是要失业"。这一事件折射出 vibe coding 浪潮正在降低编程门槛,让更多人能参与 App 创建。
原文链接:
Airbnb 首席业务官:重新定义"住进一座城市"
摘要:Airbnb 首席业务官 Dave Stephenson接受硅星人 Pro 采访,分享 AI 如何重塑旅行体验——从机场落地到本地生活的无缝衔接,AI 正在消除旅行中的信息差和不便,让"住进一座城市"而非"住在城市里"成为可能。AI 不是在替代旅行,而是在让旅行变得更加本地化和深度化。
原文链接:
📚 AI学习与观点
奥特曼"认错":你的饭碗比想象安全
摘要:Sam Altman 近期在公开场合"认错",承认此前对 AI 替代人类工作的预言过于激进。现实是放射科医生等曾被认为最易被替代的职业,目前并未出现大规模失业。奥特曼表示,AI 更多的是辅助工具而非替代者,对工作的影响比最初预期的要温和得多。这一表态被外界视为 AI 行业对早期激进宣传的一次正式回调。
原文链接:
为了不花 120 刀,我把电脑清理软件做成了开源 Skill
摘要:一位开发者受到"让 Codex 做 Mac 全盘存储分析"帖子的启发,用 Claude Code 打造了一款开源 Mac 清理 Skill,整个过程不到 120 美元成本。这个案例非常直观地展示了 AI Agent 对传统应用软件的冲击——以前需要购买专业软件的场景,现在只需一段 prompt就能替代。
原文链接:
AI+材料创业者的方法论:科学加班与情绪管理
摘要:素源矩阵创始人那荣钰(96年)分享了他用 AI 做材料研究的完整方法论:凌晨两三点工作、全蛋白质早餐、情绪稳定技巧。他调侃自己"也是个 AI",但核心观点是:AI 时代真正重要的不是被替代,而是找到用好 AI 的姿势,而不是被 AI 替代。创业者需要建立完整的身心管理系统,才能在 AI 浪潮中持续输出。
原文链接:
📢 AI招聘与活动
量子位编辑作者招聘
摘要:量子位正在招聘 AI 产业、AI 财经、AI 产品三大方向的内容编辑,覆盖北京中关村岗位,社招校招均可。这是一家追踪 AI 新进展的核心内容平台,经过8 年积累,拥有顶流影响力和时代风口的最佳观测位。如果你对 AI 领域充满热情并希望构建完整的 AI 认知体系,量子位或许是一个值得考虑的选择。
原文链接:
夜雨聆风