每日摘要 | AI追踪

每日摘要 | AI追踪 | 2026.05.26

精选优质公众号，汇总全部文章并由 AI 生成摘要，每日 17:00-18:00 推送

关注本号，每日推送不迷路

共 118 篇文章，来自 23 个公众号

📌 42章经（1篇）

本文探讨了AI技术对软件行业和产品形态的深远影响。随着AI coding工具的普及，个人和小团队能快速创建产品，推动创作群体从传统开发者向更广泛的创作者扩展。未来软件市场可能呈现哑铃结构，顶端为模型公司，底端为分散的OPC（个人或小团队创作）。同时，新的内容形式和情绪价值产品将涌现，但商业化路径仍需探索。社区连接和意义感成为新价值核心，AI虽提升生产力，但真正改变的是创造者与用户之间的连接方式。

- - -

📌 与AI同行之路（1篇）

1. 我把 Claude Code 从聊天框用成了工作流引擎,靠的是这 7 个网站

作者分享了通过7个网站提升Claude Code使用效率的经验。这些网站涵盖技能目录、学习指南、开源模板、官方培训、精选资源、深度教程和开发者社区，帮助用户从基础操作进阶到自动化工作流。核心在于利用外部工具优化交互流程，实现上下文自动携带、代码审查和规范执行，从而提升开发效率。

- - -

📌 stormzhang（1篇）

1. 该文章无标题

一位程序员帮助传统行业朋友通过AI工具提升工作效率，引发对其职业方向的思考。AI虽提升效率，但传统行业仍缺乏相关人才，具备AI能力者可考虑转行至传统行业，以实现高效率、低压力的工作状态。文章指出，传统行业对AI需求迫切，AI从业者有机会在这些领域找到高回报的工作机会。

- - -

📌 AI秘塔（1篇）

1. 最近的一些更新

秘塔AI近期更新视频搜索库，数据规模扩大10倍，搜索深度提升33%，速度翻倍。新增事实核验功能，支持自动核查上传内容中的事实信息，帮助用户高效验证引文、数据等。用户可通过秘塔首页使用该功能，提升信息准确性，适用于学术、教学等场景。

- - -

📌 十字路口Crossing（2篇）

1. 实测 OmniWork：搞调研、做动画、造游戏，用 AI 攒一个「全干班子」是什么体验？

OmniWork 是一款面向创作工作的 AI Agent 操作系统，旨在通过多个专家协作完成完整作品。实测显示，它能高效执行趋势调研、动画制作和游戏开发任务，实现从零到成品的全流程自动化。系统通过结构化技能和专家分工，提升创作效率，降低技术门槛，未来可能重塑创作工具与服务的边界。

2. FDE：AI时代的职业转型号角已吹响？

文章探讨了AI时代新兴职业形态FDE（Forward Deployed Engineer）的兴起与特点，指出其不同于传统咨询和软件外包，而是模型公司派工程师深入客户现场，推动模型能力落地。FDE在OpenAI、Anthropic等公司推动下逐渐成为显性岗位，具备较高的薪资和成长空间。文章分析了FDE与传统岗位的区别，强调其对模型边界、客户需求和产品形态的探索能力，并指出适合FDE的人需具备沟通、适应模糊需求、工程力和商业敏感度等特质。

- - -

📌 花叔（2篇）

1. 何恺明和字节Seed跳入同一条河流

2024年5月，字节Seed与MIT何恺明团队分别发布Cola DLM和ELF论文，均提出将语言模型从自回归生成转向连续潜空间生成。两篇论文核心在于将离散化操作延后至生成末尾，使模型在连续空间中进行语义推理，再最终输出文本。ELF采用极简设计，仅用基础模型和简单损失函数，显著提升生成效率；Cola则通过分层架构，先生成语义向量再翻译为文本，强调思考与表达的分离。两篇论文虽路径不同，但均挑战了语言模型需在离散空间生成的假设，标志着语言建模范式的重要转变。

2. 一人公司的门面不能输，我用Lovart当我的品牌部

作者通过统一多平台视觉形象，意识到品牌对降低交易成本的重要性。借助Lovart工具，他实现了品牌资产导入、字体生成、封面设计、表情包制作、Mockup展示及PSD导出等全流程管理，解决了风格不统一的问题。Lovart以低价格提供专业设计服务，帮助一人公司高效管理品牌视觉，提升专业度与辨识度。

- - -

📌 数字生命卡兹克（2篇）

1. AI时代的人才，我觉得最重要的是这6点特质。

本文总结了AI时代对人才的六大核心特质：好奇心、靠谱、有事实洁癖、多元化思维、能忍受不确定性、低ego高自驱。作者认为，这些特质比传统技能更具价值，是应对AI快速变化的关键。好奇心驱动持续学习，靠谱建立信任，事实洁癖确保信息准确，多元化思维促进跨领域创新，忍受不确定性适应变化，低ego高自驱则促进自我提升与团队协作。这些特质决定了一个人在AI时代是否具备竞争力。

2. 我折腾了好久的Skills团队共享，终于有产品替我做出来了。

作者分享了在团队中实现Skills共享的困难与尝试，最终发现阿里Accio Work推出了支持团队Skills和Agent共享的企业版功能，解决了小团队协作中Skills同步、版本更新和权限管理等问题。该产品实现了Skills自动更新、团队成员协作与权限管理，为中小团队提供了便捷的Agent协同方案，体现了团队协作在Agent产品中的重要性。

- - -

📌 i 小声读书（2篇）

1. 写给还想抄底恒科的朋友：每次以为要回本，它就再给我一刀

作者分享了五年来持有恒生科技指数ETF的亏损经历，揭示了中概股面临的多重监管、政策风险及市场不确定性。文章指出，尽管恒科曾多次出现反弹，但每次接近回本时都会遭遇新一轮下跌，反映出市场对其风险溢价的持续定价。作者强调中概股的折价并非低估，而是风险的体现，并建议投资者避免加杠杆和融资操作，理性看待中概股投资价值。

2. 港股要变天了

文章分析指出，内地资金撤离对美股影响有限，但对港股尤其是小盘股冲击较大。证监会处罚导致跨境券商客户资金流动，港股通范围外的小盘股面临流动性危机，可能加速“仙化”。港股正逐渐失去独立性，趋于依赖A股市场。建议投资者对港股通核心资产保持持仓，谨慎对待流动性差的小盘股，同时关注跨境投资合规化趋势。

- - -

📌 逛逛GitHub（2篇）

1. 让你的 Claude Code 满血复活，Anthropic 在 GitHub 上开源了个插件。

Anthropic 在 GitHub 开源了官方 Claude Code 插件集合 claude-plugins-official，提供 30 多个内部和 10 多个外部插件，涵盖代码审查、功能开发、遗留系统迁移等功能。用户可通过命令或图形界面安装插件，提升开发效率。推荐插件包括 claude-code-setup、feature-dev、hookify 和 code-modernization，支持自动化配置、结构化开发流程、Hook 管理及代码现代化。项目已获 2 万多星标，开源地址为 https://github.com/anthropics/claude-plugins-official。

2. 同时拿下 Office 文件和飞书、钉钉、企微，办公小浣熊 2.0 来了。

办公小浣熊2.0桌面版推出，主打本地文件直读与企业IM工具（飞书、钉钉、企微）打通，提升AI办公效率。新版本支持文件夹直读、浏览器自动化、全局快捷唤醒、跨平台协作等功能，强化AI在真实办公场景中的执行能力。同时，推出真实任务挑战活动，提供高额奖励，鼓励用户实践AI办公能力。

- - -

📌 老码小张（2篇）

1. 思考的快与慢：用 Prolog 给 LLM 装上理性大脑，然后引入知识图谱，做结构化知识双向同步，这个 agent 能力有点炸裂...

文章提出通过将 Prolog 引擎与 LLM 结合，构建一个具备确定性推理能力的智能代理 Prolog-World。该系统引入知识图谱和规划器，实现结构化知识的双向同步与逻辑推理，弥补 LLM 在逻辑验证和可追溯性上的不足。核心架构分为 System 1（LLM）与 System 2（Prolog+知识图谱+规划器），支持任务规划、语义检索和外部世界交互，提升推理的可靠性与可验证性。项目已开源，适用于需要精确逻辑推理和知识管理的场景。

2. DeepSeek 出了个终端编程 Agent，刚开源就8.1k Star了，我把代码读完后发现，它真正的壁垒不是 AI，是会计

DeepSeek 新推出的终端编程 Agent Reasonix 开源后迅速获得 8.1k 星标，其核心优势在于深度利用 DeepSeek 的前缀缓存机制，显著降低 API 成本。通过“上下文分区”设计、工具调用修复和成本控制策略，实现高效、低成本的长期运行。与同类工具相比，Reasonix 更注重成本优化而非模型能力，适合终端用户、成本敏感开发者及需长会话工作的场景。

- - -

📌 鲲鹏Talk（2篇）

1. 美团开源了一个能商用的数字人引擎，我试了试觉得有点东西

美团开源了LongCat-Video-Avatar 1.5数字人引擎，支持音频驱动生成高精度唇同步视频，覆盖真人、动漫及动物角色。该模型基于Dense DiT架构，采用Whisper-Large-v3音频编码器，提升自然度与稳定性，并支持多种任务模式及分辨率。开源授权MIT，适用于学术与商用，已通过多场景评测，表现优于部分商业方案。部署需较高硬件配置，但通过量化与蒸馏降低门槛，适合本地化应用与批量生成。

2. 本地 LLM 实战进阶：llama.cpp 服务端完整调优指南（基于 8GB VRAM 硬件的 MoE 模型优化

本文介绍了在8GB显存下运行20B参数MoE模型的优化方法，通过调整llama.cpp的多个关键参数，实现39.5 tok/s的推理速度并保持7GB VRAM占用。核心优化包括ncmoe控制专家分布、启用Flash Attention、使用q8_0格式KV缓存等。文章提供了完整命令、参数作用说明、VRAM计算公式及不同硬件配置建议，强调自行编译的重要性，并给出常见问题的解决方法。

- - -

📌 AGI Hunt（3篇）

1. Anthropic CFO 播客：两年涨120倍，什么因素可能阻碍人工智能革命？

Anthropic CFO Krishna Rao 在播客中透露，公司两年内收入增长120倍至300亿美元，核心驱动力为AI在企业市场的高回报。他强调算力管理、模型自我优化和灵活调度能力是关键，同时指出AI革命可能受制于企业应用扩散速度、scaling laws失效及竞争加剧等因素。Anthropic通过多平台算力部署、内部工具开发和定价策略稳定，持续推动技术前沿，并在安全与伦理方面保持高度关注。

2. Karpathy入职Anthropic后的职称是技术人员

3. 离谱……面壁让 AI 写了个训练框架，然后它自己训出了最强的 1B 模型：MiniCPM5-1B

面壁发布MiniCPM5-1B，成为1B参数量级性能最强的端侧文本大模型，智能指数达17.9。该模型由AI自主编写的训练框架ForgeTrain训练而成，训练速度超越英伟达Megatron。模型支持多种量化部署，可在手机等设备上运行，并在多项基准测试中表现优异。其数据治理方案和AI造AI的研发范式，标志着大模型智能密度持续提升，为国产芯片适配提供了新路径。

- - -

📌 刘小排r（3篇）

1. 我从今天开始不再每日写复盘了

2. 在海边工作的真实感受

作者分享了在海边工作的体验，揭示了看似理想的工作环境背后的实际困扰。电脑屏幕反光、防晒帽被风吹走、键盘进沙、海风实为散热口风等细节，展现了海边工作的不便。尽管环境优美，但实际使用电脑并不理想。最终作者建议，到海边不如放下电脑，好好聆听海声。

3. 装厉害税

文章指出，为了获得他人认可而做出的无效努力，被称为“装厉害税”。作者列举了五类典型的“装厉害”行为，如热心指导、朋友圈产品、热词自媒体、面试黑话和火车高谈。这些行为虽能带来短期认可，却阻碍个人成长。文章强调应建立“内部记分卡”，关注自身成长而非外部评价，避免被虚假的认同所困。

- - -

📌 AI寒武纪（3篇）

1. Codex「自我蒸馏」提示词进化版！官方团队给出更强方案，一键打包你的专属工作流

Codex团队推出升级版提示词，通过回顾会话、记忆与日志，识别重复性工作流程，自动创建最小化技能、子代理或自动化。该方案优先复用已有内容，仅针对高频、可重复且有价值的流程进行打包，提升效率与一致性。用户可复制提示词使用，Codex会生成候选清单并推荐合适形式，确保实用、精准且易于验证。

2. 重磅！华为何庭波正式提出τ缩放定律，晶体管密度直指1.4纳米制程，麒麟2026首发验证

华为半导体负责人何庭波在ISCAS会议上提出τ缩放定律，主张以时间常数τ作为半导体演进的核心优化目标，覆盖从晶体管到数据中心的十二个数量级。该定律突破摩尔定律限制，通过LogicFolding等技术实现晶体管密度跃升至238 MTr/mm²，并推动麒麟2026性能提升。τ缩放还应用于AI数据中心，通过统一总线、Hi-ONE和3D折叠等技术大幅压缩通信延迟，提升系统效率。该理论为行业提供统一优化框架，标志着从几何缩放向时间优化的新时代开启。

3. 审美在线、随叫随到、月薪19刀——Lovart把AI设计师这件事做认真了

Lovart 是一款面向非设计背景用户的AI设计工具，提供品牌套件、字体生成、Mock Up、技能自建等功能，帮助用户快速生成风格统一的品牌物料。其核心优势在于稳定的品牌风格输出、一键导出PSD文件及高效编辑功能，适合需频繁制作内容但缺乏设计资源的用户。目前订阅价为每月19美元，性价比高，尤其适合一人公司或品牌运营者。

- - -

📌 AI前线（4篇）

1. 台积电盈利暴涨却大削奖金？员工气愤欲罢工；00后赠母校20亿Token，被质疑仅值几百元；百倍奖金差距致内部分裂，三星HBM产线怠工｜AI周报

2. Anthropic 首次揭秘下一代 Claude 怎么造！用户吐槽直接喂模型，连 AI“做梦”都被训练

Anthropic 首次披露下一代 Claude 的发展方向，强调其正从单纯模型升级向具备长期运行、持续协作和稳定判断能力的智能体系统演进。模型研发已产品化，具备明确目标与评测体系，并引入“dreaming”机制模拟人类记忆整理。Claude 逐渐具备人格与价值观，成为数字协作者，提升组织协调能力成为新瓶颈。Anthropic 重视文档文化与内部协作，同时探索模型意识问题，致力于打造更可信、更自然的 AI 协作者。

3. 中国首次提出半导体演进新原则：华为“韬定律”5 年内冲刺等效1.4nm制程，麒麟、昇腾将先后落地量产

中国首次提出半导体演进新原则“韬定律”，以“时间缩微”替代传统“几何缩微”，通过设计优化提升芯片性能。华为基于此定律已量产381款芯片，计划2031年实现1.4nm等效水平，麒麟9040将首发逻辑折叠技术。该定律涵盖器件、电路、芯片、系统多层级优化，助力突破制程瓶颈，推动芯片设计与架构创新成为新性能杠杆。

4. Copilot 创始工程师：大多数 AI 编码“就像开着法拉利去买牛奶一样”

IBM Bob 是由 GitHub Copilot 创始工程师 Neel Sundaresan 推出的智能编码工具，旨在提升开发者效率。他强调 AI 编码工具应聚焦企业实际场景，而非仅追求模型性能。Bob 通过智能模型调度优化成本与效果，避免资源浪费。Sundaresan 认为 AI 应服务于开发者需求，而非盲目追求前沿技术，同时指出智能体应用需规范管理，防止滥用与风险扩散。

- - -

📌 硅星人Pro（6篇）

1. Cursor：请大家再爱我一次

Cursor 通过构建高效的应用层系统，逐步缩小与原生模型产品的差距，甚至在使用相同模型时实现接近原生的体验。其通过模块化设计，使模型可替换，降低对单一模型的依赖，并借助自研 Composer 模型优化成本结构，实现部分盈利。Cursor 以工程能力为核心，不再依赖模型优势，重新赢得市场信任，展现出在 AI 编程工具领域的竞争力。

2. 用了一个月，我终于明白华为为什么不做 Pura 90 Ultra

华为Pura 90系列在外观、影像和系统体验上表现出色。该系列取消Ultra版本，转而聚焦核心体验，如2亿像素长焦、抗反光屏幕和AI智拍功能，提升实用性和易用性。Pura 90 Pro和Pro Max分别主打日常使用和专业影像，价格合理，产品线清晰。华为通过精简配置，更注重用户真实需求，展现了成熟的产品策略。

3. 一股子 AI 味儿

文章探讨了“AI味”这一现象，指出人们常因文章结构工整、语言规范或内容空洞而怀疑其为AI所写，实则反映的是创作者与读者之间的表达差异。作者通过自身写作经历和案例，强调“AI味”并非标准可定，而是人味的缺失。文章还指出，随意鉴定AI写作会打击真实表达，甚至影响创作生态，呼吁理性看待AI工具，重视内容本身的价值。

4. 速冲IPO！王兴兴最清楚宇树的大问题反而是：它盈利了

宇树科技计划IPO，2025年营收达17亿元，毛利率达60%，主要依赖硬件制造和运动控制技术，暂未涉足AI决策系统。其高毛利源于专注“本体”和“小脑”，而非“大脑”研发，商业模式与长期技术目标存在错位。公司正通过上市融资加大在算法和模型研发上的投入，以突破具身智能瓶颈，实现从硬件厂商向平台型企业的转型。

5. 华为“韬(τ)定律”论文全文！

华为在ISCAS 2026上提出“韬（τ）定律”，主张以“时间缩微”替代传统几何缩微，通过统一优化时间常数τ推动半导体与电子系统演进。该理论在移动SoC和AI系统中实现验证，如LogicFolding技术提升晶体管密度与能效，Hi-ONE光互连降低通信延迟。τ缩放适用于从晶体管到系统的多层级，成为未来半导体发展的新指导原则。

6. “Token”必须死？

文章探讨了大语言模型（LLM）基于token序列的范式是否能通往通用人工智能（AGI）。指出token作为离散符号无法捕捉人类认知的连续性和丰富性，存在结构性天花板。多位专家和机构正转向连续空间建模，如何恺明团队的ELF和字节的Cola DLM，以提升效率与表现。同时，科技巨头如Google、OpenAI、字节跳动等也在探索多模态统一和连续表征。文章认为，token范式可能衰退，但替代方案仍需解决训练信号和探索能力等问题，AGI之路仍充满挑战。

- - -

📌 AI思想会（6篇）

1. 8小时狂揽15K美金！Claude Code屠榜黑客马拉松，开源神器爆15万星

Claude Code开源项目ECC在黑客马拉松中夺冠，凭借智能体优化系统赢得1.5万美元平台额度，并开源后迅速获得15万星标。该项目包含38个智能体、156项技能，通过模块化按需加载机制优化性能，内置安全测试与持续学习功能，助力开发者高效构建AI应用。其开源推动了AI开发的平权化，使独立开发者也能拥有强大工程团队支持。

2. Graphify：为代码库构建知识图谱，以图遍历替代向量检索

Graphify 是一个 Python 工具，通过构建代码库知识图谱，以图遍历替代向量检索，降低查询成本。其核心在于利用 AST 提取结构化关系，结合语义分析处理非代码内容，并通过置信度标签区分信息来源。适用于混合媒体项目和复杂调用图场景，但对小型项目或依赖语义搜索的仓库效果有限。

3. AI能预测科学突破吗？CUSP基准揭示前沿模型能力边界

AI能否预测科学突破？来自多机构的联合团队提出CUSP基准，首次在受控时间知识约束下评估AI的科学预测能力。该基准涵盖4760个科学事件，从可行性判断、机制推理到时间预测四个维度测试模型表现。研究发现，当前AI在判断科学进展是否实现、何时实现及生成方案方面存在系统性局限，尤其在时间预测和不确定性估计上表现不足，且性能在不同领域差异显著。这表明AI在科学预测任务上仍面临根本性挑战，需进一步提升前瞻性推理与不确定性校准能力。

4. GPT-5.6泄露了！

GPT-5.6疑似泄露，内部代号为iris-alpha，具备150万上下文窗口和极简UI设计，展现强大前端生成能力。其多步推理和智能体工作流升级引发行业关注，OpenAI、Anthropic、Google及马斯克团队均加速布局，6月或迎来大模型集中发布，标志着AI领域进入激烈竞争阶段。

5. 不给现金，只给超3亿美元Token！Sam Altman开始“拿算力换股份”：向169家YC公司发200万美元Token，但要拿股权来换

OpenAI通过向169家YC创业公司提供价值200万美元的Token，换取其股权，旨在绑定AI创业生态。Token可用于调用GPT模型等AI能力，替代现金支持创业公司开发产品。此举被视作OpenAI以低成本资源换取长期股权，并推动创业公司依赖其生态。争议在于Token是否值得用股权交换，以及OpenAI是否可能复制创业公司产品。

6. 在地球上探测到暗物质迹象？黑洞当放大镜，MIT等新模型从引力波中找出「可疑印记」

MIT与欧洲研究人员提出新模型，通过分析引力波波形，尝试在黑洞合并信号中寻找暗物质的印记。他们预测，若暗物质存在于黑洞周围，其引力波信号将呈现特定特征。研究团队将模型应用于LIGO-Virgo-KAGRA观测数据，发现信号GW190728可能包含暗物质印记，但尚未确认。该研究为利用引力波探测暗物质提供了新方法，有助于更精确地探索宇宙中不可见的物质成分。

- - -

📌 AI科技评论（6篇）

1. 融资数亿元，我们和贝塔无限刘武龙聊了聊具身系统创新

贝塔无限创始人刘武龙凭借华为十余年AI系统工程经验，创立具身智能公司，已完成数亿元融资。他主张融合自动驾驶、大模型与机器人技术，构建“具身大脑”系统，强调系统工程思维与商业化落地。面对行业技术路线分歧，他提出“四维一体”架构，主张分层控制与持续优化，重视真实场景数据与用户交互体验。他认为具身智能终局在于系统闭环与个性化服务，而非单纯技术堆叠。

2. X-Era蝉联双榜单冠军，引领世界模型未来方向

X-Era的EonWorld在WorldScore和WorldArena榜单上连续夺冠，展现出卓越的三维结构稳定性和物理预测能力。该模型基于VWA原生世界动作体系，不仅关注画面生成质量，更强调模型对世界变化的理解与动作决策的支持。其成绩标志着世界模型正从“生成像”转向“能用”的关键阶段，为机器人理解世界并执行任务提供了更坚实的基础。

3. 独家丨天机智能完成10亿元B轮及B+轮融资，估值近百亿，高瓴、美团联合领投

天机智能完成10亿元B轮及B+轮融资，投后估值近百亿元，高瓴、美团联合领投。公司专注于具身智能底层技术，打造力控人形双臂，已实现量产交付并覆盖全球45家头部厂商。其自研传感器与控制架构性能领先，最新产品单臂自重仅8kg。本轮资金将用于加强核心技术、提升产能及拓展海外市场，推动其成为具身智能产业链关键环节。

4. 港中文李鸿升团队论文 MindVLA-U1：VLA 不再输给 VA，语言真正进入自动驾驶决策

港中文李鸿升团队提出MindVLA-U1，通过统一视觉语言动作架构，实现自动驾驶中语言理解与动作规划的深度融合。该模型结合Intent-CFG与流式记忆机制，提升轨迹生成精度与语义可控性，在WOD-E2E基准测试中表现优异，验证了VLA在复杂场景下的优势。研究探索了快慢推理路径，兼顾实时性与安全性，为自动驾驶决策系统提供了新的架构方向。

5. 1B 参数跑出 2B 性能？面壁 MiniCPM5-1B 用 AI 自进化，提速 AGI 进程

面壁智能发布全球首个由AI创造的基座模型MiniCPM5-1B，以1B参数实现超越2B模型的性能表现。该模型通过“AI制造AI”的自进化范式，重构了模型、框架与数据的协同体系，大幅降低研发成本与周期。MiniCPM5-1B在多个评测中表现优异，具备端侧部署能力，支持多种精度压缩，推动AI研发向工业化、自进化方向发展，助力AGI进程提速。

6. 从「时域建模」到「频域融合」：中山大学团队为传感器人体活动识别提供新思路｜ TPAMI 2026

中山大学团队在IEEE TPAMI 2026发表的研究提出TSF框架，通过三重频域融合（傅里叶域、图傅里叶域、小波域）突破传感器人体活动识别（HAR）瓶颈。该方法从物理机制出发，针对IMU传感器噪声特性进行自适应滤波与特征提取，有效提升识别精度，同时降低参数量与计算复杂度，展现良好可解释性。实验表明TSF在多个数据集上表现优异，为HAR领域提供新思路。

- - -

📌 极客公园（8篇）

1. 「死了么」App 被「收编」，改名「在么在么」；台积电盈利大增却传出削减奖金，员工酝酿罢工；NVIDIA 杀入 CPU 市场 | 极客早知道

神舟二十三号航天员成功进驻中国空间站，实现第八次“太空会师”。NVIDIA推出Vera CPU，预计在性能和密度上超越x86芯片，与Intel在Computex展开竞争。台积电盈利增长但传出削减奖金，员工酝酿罢工。杭州“在么在么”App升级用于独居老人监测，AI生成文章数量已超人类。AI领域融资总额超1100亿元，国产大模型融资激增。新型全息3D打印技术效率提升70倍。科大讯飞发布新款智能办公本，支持离线AI功能。苹果iOS 27将优化AirPods设置界面。企业强推AI提效却面临成本过高问题。

2. 具脑磐石完成亿元融资，前华为具身一号位押注 JEPA 具身路线

具脑磐石完成亿元级融资，采用JEPA架构构建认知世界模型，探索低数据、高泛化、终身学习和低功耗的具身智能新路径。公司以类脑智能为底层范式，强调算法创新而非单纯依赖数据和算力，旨在突破现有具身智能的结构性瓶颈。创始人朱森华曾任职华为，具备跨学科背景，团队具备商业化落地能力，已在多个场景开展验证。公司聚焦于认知模型与真实场景结合，推动技术从实验室走向实际应用。

3. Gemini 3.5 Flash 实测：当模型速度进入 4G 时代，Agent 的游戏规则变了 | AI上新

Google 在 I/O 大会上推出 Gemini 3.5 Flash，其响应速度达 289 tokens/秒，首 token 延迟仅 65 毫秒，显著优于同类模型。实测显示，Gemini 在 Agent 场景下表现突出，尤其在长程任务和代码生成效率方面优势明显，虽在部分测试中表现稍逊，但整体速度优势使其在实时交互和任务处理效率上实现质变，标志着模型体验进入“4G 时代”。

4. 阿里云的「Agentic 时刻」

阿里云在520峰会上推出Agentic Cloud体系，重构技术栈以适配Agent需求，涵盖芯片、云能力、大模型和推理平台。重点推出Qwen3.7-Max模型、百炼平台及56款产品Skill化，提升Agent任务调度与资源管理能力。同时推出新官网千问云，聚焦模型调用与Agent交互体验。阿里云正从传统云服务向Agent驱动的商业化转型，重新定义云的价值衡量标准。

5. 微软按下 vibe coding 暂停键：烧 token 已经比员工贵了

微软取消内部 Claude Code 许可，因 AI token 成本过高，远超员工薪资。此举反映 AI 替代人力的经济模型面临挑战，token 费用随使用量增长而激增，导致企业成本结构失控。YC 则主张通过 AI 替代人力，将 token 视为资产替代，而非单纯支出。文章指出，AI 与组织结构的匹配是关键，传统公司难以承受 AI 带来的成本压力，而 AI-native 公司则通过重构资产形式实现效率与成本平衡。

6. 打破光刻工艺束缚，华为提出「韬定律」；宇树科技将于 6 月 1 日接受科创板上市审核；追觅官宣 C 罗出任全球代言人 | 极客早知道

华为提出“韬定律”以“时间缩微”替代传统光刻工艺，推动芯片技术发展；宇树科技将于6月1日接受科创板审核，其人形机器人实现全球商用落地；谷歌承认Gemini在AI编程领域落后，OpenAI在新加坡设立首个海外AI实验室；追觅官宣C罗为全球代言人；中科宇航力箭一号火箭拟执行“一箭八星”任务；法拉利发布首款纯电动车Ferrari Luce；逐际动力发布具备27自由度的人形机器人LimX Luna；OPPO Reno16系列推出真3D悬浮工艺手机；首个全自动AI科学家Robin两小时发现致盲眼病新药。

7. 对话奇点光子谢崇进：当英伟达用 45 亿美元，「烧」火了赛道

AI算力增长推动光互连成为关键领域，英伟达投资加速行业热度。奇点光子创始人谢崇进凭借三十年光通信经验，聚焦当前客户需求，推出高密度光芯片产品，采用NPO/CPO封装方案，兼顾性能与量产能力。公司不押技术终局，而是瞄准2027年前市场窗口，专注解决超算中心GPU互联难题，定位为关键部件供应商，不与大厂竞争系统方案，而是为云厂商、GPU厂商等提供可集成的光互连芯片，助力AI算力升级。

8. 不止于Copilot：医渡科技超级智能体，想做医疗界的Claude Code

医渡科技通过12年医疗数据积累，构建了嵌入诊疗流程的智能体系统，实现AI在医疗场景中的深度应用。其架构融合通用大模型与医疗专用模型，支持循证、可追溯、可审查的智能决策。通过嵌入医生工作流，实现智能体与医生协作，提升诊疗效率并推动商业化落地。目前已在三甲医院实现高渗透率，2026年预计实现全年盈利，标志着医疗AI在生产力变革上的突破。

- - -

📌 InfoQ（9篇）

1. 微软将弃用Claude：太贵了还是薅明白了？

微软因Claude Code成本过高而叫停其在内部工程师中的使用，转向自家GitHub Copilot CLI。此举不仅出于成本考量，也是一场内部测试，旨在通过对比提升自身产品。微软面临三大困境：缺乏自研通用大模型、产品力不敌竞品、生态控制权减弱。随着Anthropic和OpenAI的崛起，微软在AI领域的主导地位受到挑战，其依赖外部模型的模式正遭遇利润和控制力的双重流失。

2. Copilot 创始工程师：大多数 AI 编码“就像开着法拉利去买牛奶一样

IBM Bob 是由 GitHub Copilot 创始工程师 Neel Sundaresan 领导开发的智能编码工具，旨在提升开发者效率。与当前 AI 编码工具不同，Bob 聚焦于代码自动补全与推荐，而非生成代码。Sundaresan 强调用户体验与模型性能的分离，主张根据任务需求智能调度模型，避免资源浪费。他指出多数 AI 工具被滥用，如用顶级模型处理简单任务，成本高昂且不必要。IBM 内部的庞大用户群体和多样化工作负载为 Bob 提供了独特优势，使其能适应复杂企业场景。

3. 大规模工程支撑场景下的多智能体系统设计：Grab 实践案例

Grab 推出多智能体系统，用于自动化数据平台中的运维支持工作流，减少重复性任务，提升问题解决效率。系统分为调查与增强两大工作流，分别处理问题诊断与代码生成。采用 LangGraph 和 FastAPI 构建，整合工具生态，优化上下文管理与安全性。该系统有效释放工程人力，推动团队从应急处理转向系统构建。

4. Anthropic 推出 MCP 隧道，供私有代理访问内部系统

Anthropic 推出 MCP 隧道和自托管沙箱功能，以增强企业使用 Claude Managed Agents 的安全性与控制力。MCP 隧道允许代理连接私有系统而无需公网暴露，通过加密出站连接实现安全访问。自托管沙箱支持多种托管服务，使企业能自主管理计算资源与数据驻留。两项功能旨在满足企业在安全边界内运行 AI 代理的需求，提升部署效率与合规性。

5. 中国首次提出半导体演进新原则：华为“韬定律”5 年内冲刺等效1.4nm制程，麒麟、昇腾将先后落地量产

中国首次提出半导体演进新原则“韬定律”，以时间缩微替代传统几何缩微，提升芯片性能。华为基于此定律已量产381款芯片，预计2031年实现1.4nm等效水平。麒麟9040将首发逻辑折叠技术，提升晶体管密度与性能。该技术通过设计优化降低信号延迟，突破制程限制，推动芯片设计与系统架构成为新性能杠杆。

6. 编程 Agent 可能是软件开发史上最昂贵的错误之一

文章指出，George Hotz认为将AI Agent引入软件开发可能成为历史上代价最重的错误。他通过实践发现，AI生成的代码质量差且难以察觉，无法替代程序员。文章提到，AI在提升效率的同时也带来代码质量下降、维护困难等问题，尤其在大型组织中影响更严重。此外，部分公司已出现AI使用成本高、产出不匹配的困境，引发对AI编程工具大规模应用的担忧。

7. Coding Agent 在百度的落地实践：从反馈闭环到工程范式重构

百度在Coding Agent的落地实践中，通过构建反馈闭环、Benchmark评测和Agent Engineers体系，有效应对了模型快速迭代带来的架构挑战。Comate团队实现了用户每周人均Query次数达90余次，Agent应用覆盖非开发者和开发者，支持代码探索、调试和功能实现等场景。通过双层Loop架构、异常值评测、任务复杂度分析和工具执行网络等工程实践，提升了Agent的稳定性与效率。同时，推动全员转型，打破角色边界，强化人与Agent的协作，实现全栈能力提升与高效交付。

8. 上下文窗口限制被打破：Subquadratic推出了一个1200万Token的窗口

Subquadratic 推出一款支持 1200 万 Token 上下文窗口的模型，宣称其 SSA 架构在计算和内存上与上下文长度呈线性增长，相较密集注意力效率提升显著。该模型在多个基准测试中表现优异，如 MRCR v2 得分 83，超越 OpenAI 模型。公司计划推出 5000 万 Token 版本，并通过 API 和代理工具提供服务，但尚未开源权重。

9. OpenAI 详解规模化低延迟语音 AI 的 WebRTC 架构

OpenAI 介绍了其为实现全球低延迟语音 AI 所采用的 WebRTC 架构调整。新架构采用中继收发器模型，将 WebRTC 会话状态集中于收发器层，利用轻量级中继减少 UDP 暴露并优化媒体路由。该方案解决了传统架构在 Kubernetes 环境中的运维难题，通过职责分离，避免复杂逻辑分散，提升系统稳定性和可扩展性。此架构已应用于 ChatGPT 语音和 Realtime API 等产品。

- - -

📌 机器之心（15篇）

1. 还在手写CUDA内核？CODA来了！LLM和新手也能让Transformer跑出光速

CODA 是一项新研究，提出将 Transformer 中的内存密集型操作通过数学重写，整合到 GEMM 内核的尾声阶段，以减少显存访问开销。该方法支持人工和 AI 生成代码，实现高效内核编写。实验显示，CODA 在多个算子和模型规模上均优于现有优化方案，尤其在反向传播中提升显著。目前支持单 GPU 场景，适用于标准 Transformer 架构。

2. RSS 2026｜机器人别等失败了才补救，AgentChord让恢复动作提前写进任务图

机器人操作面临复杂环境下的失败风险，传统方法依赖事后补救，存在延迟和效率问题。香港中文大学（深圳）等团队提出AgentChord系统，通过在任务图中提前编排恢复动作，实现失败前的主动应对。该系统将任务、失败与恢复整合至同一图结构，利用三个智能体协同完成任务规划与恢复编排，提升执行稳定性与效率。实验表明，AgentChord在仿真与真实环境中均表现出色，成功率和执行时间优于现有方法，为机器人操作提供了更可靠的恢复机制。

3. Claude 通过率不到 4%，SaaS-Bench 撕碎了 Computer-Use 的「全自动办公」幻想

SaaS-Bench 测试显示，当前 AI Agent 在处理真实办公任务时表现不佳，通过率不足4%。测试涵盖23个真实SaaS系统，任务涉及跨应用、长流程操作，揭示Agent在持续状态推理、错误恢复和闭环验证方面存在结构性缺陷。结果显示，多数模型无法完成复杂任务，且执行不稳定，暴露出“全自动办公”幻想与现实之间的巨大差距。

4. 从「说错话」到「干错事」：复旦、CityUHK、SMU、UIUC等13家机构联合发布「具身智能安全」综述

多所高校与研究机构联合发布《具身智能安全》综述，指出随着具身智能系统从实验室走向现实，其安全风险由“说错话”升级为“干错事”。综述提出“能力—风险”二象性理论，认为系统能力越强，攻击面越广，风险越严重。文章梳理了具身智能五层能力栈中的攻击面与威胁，并强调需从整体视角设计安全机制，而非事后补救。

5. 性能超越李飞飞，他们把10亿高斯点的3D世界装进浏览器

李飞飞团队与群核科技联合推进3D高斯技术，群核开源的Aholo Viewer在渲染速度和大场景加载性能上超越Spark 2.0，支持10亿高斯点的超大3D场景流畅运行。该技术通过Chunk-based LOD Tree优化，实现内存减半、加载快1倍、渲染快3倍，推动互联网从二维向三维内容转型，为AI理解物理世界提供关键数据支持，标志着空间智能成为下一代互联网基础能力。

6. 告别多奖励跷跷板：Flow-OPD将多教师OPD带入图像生成

中国科学技术大学等机构联合提出Flow-OPD框架，首次将在线策略蒸馏应用于流匹配模型，解决多任务训练中的梯度冲突与能力衰退问题。该方法通过多教师OPD蒸馏，结合动态任务路由与流形锚点正则化，实现文本渲染、图像质量等多维度性能的全面提升。实验表明，Flow-OPD在多任务联合优化中表现出色，展现出超越单一专家模型的潜力，为构建通用视觉生成模型提供了新范式。

7. 一个问题几百美元，DeepMind智能体一次搞定了9个Erdős问题

DeepMind 的 AI 智能体通过 AlphaProof Nexus 框架，成功解决了 9 个长期未解的 Erdős 数学问题，涵盖数论、组合数学等领域。该方法结合大模型的创造力与 Lean 编译器的严谨性，实现自动解题与验证，成本控制在数百美元内。研究展示了 AI 在数学研究中的潜力，并为未来智能体架构设计提供了新思路。

8. VeRL-Omni：面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架，支持扩散与全模态模型，如 Qwen-Image、Qwen-Omni 等。该框架集成 vLLM-Omni 实现高效多模态 rollout，支持异构流水线与复杂负载调度，并提供灵活的奖励引擎和模块化训练后端。通过异步高吞吐生成与奖励计算重叠，显著降低训练延迟。同时兼容 NVIDIA GPU 和昇腾 NPU，支持多种训练策略与算法扩展，旨在推动高效多模态 RL 训练发展。

9. 并购激励金都不要了？全程踩中AI Coding，Windsurf核心工程师离开DeepMind

Ronak Malde 从 Codeium 到 Windsurf，再加入 DeepMind，现选择离职并放弃并购激励。他参与开发了 SWE-1 和 Antigravity 等关键项目，认为 AI 研究应聚焦正确方向，团队需高效决策与快速迭代。他强调 AI Coding 领域人才流动频繁，未来将继续探索新方向，推动行业变革。

10. 解码加速15倍！EdgeRazor助推大模型在PC/移动端“狂飙”

EdgeRazor 是由南京大学与微软联合推出的开源工具库，通过混合精度量化感知蒸馏技术，解决了端侧部署大模型的“不可能三角”问题。该框架在极低比特下保持高性能，实现15倍推理加速和显著压缩比，支持灵活训练数据配比，适用于PC、手机等资源受限设备，为大模型轻量化部署提供了高效、低成本的解决方案。

11. 后OpenClaw时代！国产Agent模型凭「高配低价」叫板Opus 4.6

国产Agent模型SkyClaw-v1.0发布，凭借高性能与低成本优势，挑战OpenClaw等主流模型。该模型在智能体能力、使用门槛和性价比三方面表现突出，支持复杂任务处理与多平台适配，限时免费开放体验，为开发者提供更高效、易用的Agent解决方案。

12. ACL 2026｜证据摊开看，场景图画清：让流式视频大模型拿捏「何时开口」

ACL 2026上，研究团队提出Response-G1框架，通过显式场景图建模，解决流式视频大模型在主动交互中“何时开口”的难题。该方法将视觉证据与响应条件结构化对齐，提升模型对响应时机的判断能力。实验表明，在主动与被动任务中均取得显著性能提升，为流式视频理解提供了更可解释、可调试的解决方案。

13. 不用人类手写训练框架了！AI自己写代码，训出1B端侧「小钢炮」

面壁推出1B参数端侧大模型MiniCPM5-1B，主打低成本部署与高效运行，支持本地化应用。该模型在同尺寸中表现突出，超越多款主流模型，且由AI自动生成的训练框架ForgeTrain训练完成，提升训练效率。模型提供多种量化版本，适应不同设备部署，推动端侧AI发展，标志着AI制造AI的实践落地。

14. xAI解散，但Grok还在上新，马斯克官宣新模型

xAI解散后，Grok仍持续发展。马斯克宣布Grok V9-Medium模型已完成训练，参数量达1.5T，性能优于前代，并针对Blackwell架构优化。该模型将在两周内发布，支持复杂编程任务。同时，马斯克收购Cursor获取真实开发者数据，提升模型实用性。新推出的Grok Build作为编程智能体，具备计划模式、并行子智能体等功能，加入终端编程智能体竞争。目前其底层模型仍有提升空间，未来表现值得关注。

15. ACL 2026 Main | 不只是调用地图API，Spatial-Agent让大模型生成可执行地理分析工作流

Spatial-Agent 是一种基于地理分析工作流的LLM代理框架，旨在将自然语言问题转化为可执行的GeoFlow Graph，以解决复杂的地理空间任务。该方法引入空间概念和功能角色，结合预定义模板，确保分析流程的正确性与可验证性。实验表明，Spatial-Agent在多个基准测试中显著提升性能，验证了其在地理分析任务中的有效性。

- - -

📌 新智元（18篇）

1. 8小时狂揽15K美金！Claude Code屠榜黑客马拉松，开源神器爆15万星

旧金山开发者Affaan Mustafa利用Claude Code构建了包含38个智能体、156项技能的系统，开源后迅速获得15万星标。他在黑客马拉松中凭借该系统夺冠，并推出AI客户调研平台Zenith，帮助创业者验证创意。该项目开源后因模块化设计、高效资源管理及安全机制广受关注，体现了AI智能体在开发流程中的强大赋能作用。

2. 前DeepMind华人研究员离职喊话：AI行业所有人都搞错了方向

前DeepMind研究员Lun Wang离职后指出，AI行业当前最大的瓶颈并非算力或数据，而是评估体系。现有基准测试、安全评估和红队测试均假设模型只是当前版本的增强，若模型进入全新能力区间，评估体系将失效。他强调，评估是训练和安全的上游基础，错误的评估会导致训练目标偏差，进而影响模型行为。真正的挑战在于如何预测并评估未知能力，目前尚无有效解决方案。

3. Claude「永久大脑」，真的来了！

Claude推出「双记忆系统」，包含「文件记忆」与「梦境」功能，实现持久、结构化记忆管理与自动整合。新功能支持无限扩展、按需检索，并通过「Dreams」模拟人类REM睡眠机制优化记忆。同时，Conway作为7x24小时运行的AI平台亮相，标志着Claude在持久记忆生态竞争中迈出关键一步，为未来AI发展奠定基础。

4. 华人数学家封神！50年数论难题一朝破解

华人数学家张欣攻克困扰数学界50年的Zaremba猜想，其成果基于导师Alex Kontorovich早期研究，并借助Ilya Shkredov近期突破性成果完成。该猜想涉及连分数展开中部分商的上限问题，对数值积分和伪随机数生成有重要意义。张欣通过系统性积累与关键拼图的结合，成功证明了猜想对所有正整数成立，标志着数论领域的重要进展。

5. Claude不到4%，全军覆没！一场大考撕碎Agent「全自动办公」幻想

SaaS-Bench测试显示，当前AI Agent在真实办公场景中表现不佳，多数任务无法完整执行。测试覆盖23个真实SaaS系统，任务涉及多应用、长流程和多模态操作。结果显示，最强模型Claude Opus 4.7仅完成4个任务，整体通过率极低。测试揭示Agent存在四大结构性缺陷：任务越长越易出错、错误扩散、缺乏自我检查和执行不稳定，暴露了其在长程任务中缺乏全局状态推理和闭环验证能力，表明Agent距离真正实用仍有较大差距。

6. 30天烧掉60万亿，扎克伯格没进前250：大厂AI沦为KPI游戏

亚马逊和Meta等大厂内部推行AI使用排行榜，导致员工为提升token消耗量而刷AI，形成“tokenmaxxing”现象。尽管公司声称不考核，但管理层压力促使员工过度使用AI工具，实际产出与token消耗不成正比。Jellyfish数据显示，高token用量并未显著提升效率，反而增加成本。这种行为背后是资本对AI基建投资的背书，但也引发对激励机制扭曲效率的担忧。

7. 胜率直逼人类大师！这套Agent揭开中国AI「玄学真相」

Tianfu Agent在无信息泄漏的术数专业题库测试中，准确率提升至50%，接近人类Top20选手水平。该系统通过多Sub-Agent协作、工具分级管理及不确定性量化机制，有效提升推理能力。研究展示了垂直领域Agent开发的工程经验，包括工具封装、动态注入与置信度评估，对类似领域具有参考价值。

8. 刚刚，Ilya又发神图「思考者」！AI芯片海洋上在想啥？

Ilya在Instagram发布一幅以《思考者》为灵感的Die Shot图，引发广泛关注。画面中思考者站在芯片微观结构上，隐喻AI与硅基技术的融合。同期，OpenAI在数学、Codex功能及IPO计划上取得多项突破，释放AGI临近的信号。文章指出，Ilya通过艺术与技术结合，暗示AI正推动范式跃迁，AGI或已进入现实变量。

9. 新智元ALL in ASI英雄帖

新智元面向2026年ASI奇点之年，招募ASI架构师与主笔，年薪50-70万，工作地点在北京上地。岗位要求具备AI技术能力与内容创作经验，分别负责工程落地与深度报道。公司强调全球AI前沿洞察与内容质量，提供顶级AI工具与行业影响力平台，吸引有使命感的同行者共同推动ASI时代发展。

10. GPT-5.6泄露了！

GPT-5.6意外泄露，展现150万Token上下文窗口和极简神级UI，引发AI界震动。OpenAI加速迭代，计划6月发布，与Anthropic、Google等竞相发力，推动6月成为大模型爆发期。模型在多步推理和智能体工作流上实现重大升级，预示AI军备竞赛加剧。

11. 人类56年解不出，谷歌AI一夜连破9道世纪难题！

谷歌DeepMind推出的AlphaProof Nexus AI数学智能体，一次性解决了9道长期未解的Erdős开放问题，其中最老的悬而未决56年。所有证明均通过Lean编译器形式化验证，确保无误。该系统融合了大语言模型、AlphaProof和进化算法，采用多层级架构协同工作，实现高效、准确的数学证明。

12. 一个月的活一周干完！英伟达世界模型训练速度飙升400%

英伟达发布的世界动作模型DreamZero在两项机器人基准测试中表现优异，但训练周期长、成本高。无问芯穹联合清华推出的RLinf框架通过算子优化、FSDP2并行策略、I/O加速等手段，实现近4倍训练吞吐提升，使原本需25天的训练缩短至约6天，显著降低学习成本，推动具身智能领域高效迭代。

13. 算法1年翻倍，芯片2年翻倍？重磅实锤：AI正在自我加速，拦不住了

NBER最新研究显示，AI研发正形成远超其他科技领域的自我加速反馈环，芯片效率每2年翻倍，算法效率每年翻倍，叠加后推动AI算力指数增长。论文指出，即使部分自动化也能打破人类瓶颈，当研发自动化率达13%时，将触发奇点式爆发增长。模型预测，6年内AI可能实现自我迭代，进入由AI主导的快速发展阶段。

14. AI公司烧不起Token了！国产Agent杀出，逼近Opus 4.6还免费

AI公司面临高昂Token成本压力，Token已成为AI时代的“电力消耗”。SkyClaw-v1.0作为高性能Agent模型，性能接近DeepSeek V4 Pro和Claude Opus 4.6，价格仅为行业主流的一半甚至更低，并提供限时免费体验。该模型支持多场景应用，如生成PPT、开发小红书风格App和中国象棋游戏，显著提升效率与性价比。SkyClaw通过三阶段训练体系强化Agent能力，推出轻量版Lite满足不同需求，推动AI技术普惠化，助力企业降低Token成本，实现高效落地。

15. OpenAI差点没了？总裁亲述：奥特曼被罢免当天，我就辞职了

OpenAI总裁Greg Brockman在播客中首次披露2023年11月奥特曼被罢免的72小时危机。当时董事会未给出明确理由，导致Brockman辞职，引发员工请愿支持。危机暴露了公司治理结构的脆弱，最终在核心成员支持下，奥特曼回归，公司重建。Brockman强调OpenAI的使命是造出有益于人类的AGI，并将未来赌注放在持续研发模型的系统和算力上。

16. 新智元ALL in ASI英雄帖

17. 马斯克曝光Grok 5！1.5万亿参数，偷师Cursor狂练编程

马斯克宣布Grok V9-Medium训练完成，参数达1.5万亿，是现役模型的三倍，并整合了Cursor的编程交互数据以提升编程能力。该模型将与Grok Build编程Agent一同发布，标志着马斯克在AI编程领域的全面布局。尽管参数规模扩大，但实际效果仍需观察，当前Grok在企业采用率和基准测试中仍落后于竞争对手。马斯克此举或为SpaceX上市及AI竞争做准备。

18. 马斯克甩出两张王牌，Grok Build杀入AI编程

马斯克旗下xAI推出Grok Build，作为编程智能体CLI工具，旨在弥补在AI编程领域的短板。该工具面向更多用户开放，并基于性能更强的Grok V9模型，参数规模提升三倍，同时优化了硬件架构。V9通过补充训练引入Cursor数据，提升编程能力，但其实际效果仍需实测验证。Grok Build支持任务规划与执行，具备扩展性，标志着xAI在编程智能体产品线上的重要进展，即将与Claude Code、Codex等展开竞争。

- - -

📌 量子位（19篇）

1. 卷到今天，Agent的含金量还在提升丨AIGC2026圆桌论坛

2026年Agent产品进入爆发期，从概念走向实际应用，产品形态逐渐清晰，迭代节奏加快。嘉宾认为，Agent将从工具转向托付，需建立用户信任，同时面临技术快速迭代带来的决策挑战。未来Agent将更偏向商用和OPC场景，用户群体向B端和D端转移，创业机会仍存在，关键在于找到差异化定位并快速行动。

2. 华为具身大脑一号位创业，用认知科学造世界模型，获亿元级融资

华为旗下“具身大脑一号位”朱森华创立的具脑磐石，聚焦认知科学与AI结合，打造类脑认知世界模型，完成亿元级融资。公司致力于构建能理解物理世界、预测行动后果、持续学习的机器人“大脑”，通过五层架构实现从感知到主动推理的完整链路。其技术路线对标JEPA，强调低数据、高泛化、终身学习与低功耗，团队具备AI与脑科学交叉研究背景，推动具身智能从理论走向商业化落地。

3. DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

DeepSeek V4新工具Reasonix通过高缓存命中率（99.82%）大幅降低使用成本，将原本414元的账单降至81元。该工具专为DeepSeek设计，采用缓存优先循环和工具调用修复机制，优化长会话效率并自动切换模型以控制成本。项目提供简单安装方式，且强调其非通用性，仅针对DeepSeek功能构建。

4. 图灵奖得主领衔，中国大模型第一梯队集结！2026智源大会，看懂AI下一程

2026智源大会汇聚图灵奖得主与中国AI领军者，聚焦智能体与世界模型两大趋势，探讨AI在真实世界中的应用与挑战。大会涵盖25场论坛，涵盖Agent、具身智能、安全等前沿方向，推动AI从技术到产业的全面落地。同时关注AI教育与生产关系变革，展现中国大模型第一梯队的创新力量与未来方向。

5. 量子位编辑作者招聘

量子位招聘编辑、主笔、主编等岗位，涵盖AI产业、财经与产品三大方向，工作地点在北京中关村。岗位面向社招与校招，提供丰富的职业发展机会和行业资源。应聘者需具备相关领域知识与写作能力，可提交简历及代表作品。量子位作为AI领域头部新媒体，拥有庞大用户基础与行业影响力。

6. “VLA和世界模型都不是终局，会有物理世界独有的模型” | 蚂蚁灵波沈宇军@AIGC2026

大模型依赖互联网数据红利，但机器人进入物理世界面临数据空白。蚂蚁灵波沈宇军提出AIGA概念，强调从内容生成转向动作生成。他认为VLA和世界模型并非终局，未来将融合形成物理世界独有的模型。数据标准化和空间感知是关键，预计2028年前后，具身智能将进入普及阶段，人人可为机器人提供数据，实现类似ChatGPT的突破。

7. 抢疯了！AI宠物翻译器：800多块，预售2万单

AI宠物翻译器PettiChat预售2万单，售价800多元，能将猫狗叫声实时翻译成文字并实现双向对话，准确率达95%。产品具备情绪识别、音色克隆、位置追踪等功能，通过大模型分析叫声特征，推测宠物意图。尽管其翻译准确性存疑，但为宠物与人类沟通提供了新方式，引发市场关注。

8. 京东JoyInside戴文军：AI的终极形态不是聊天，是融入你家每一件物品丨AIGC2026

京东科技JoyInside业务负责人戴文军在AIGC2026峰会上提出，AI的终极形态是深度融入物理世界的“AI World”，未来硬件将像人一样主动感知并满足用户需求。他强调，AI应从数字空间走向线下，通过“附身智能”技术，将AI植入家居、机器人等设备，提升家庭生活体验。京东依托大模型、供应链与产业场景，推动AI从千行百业走向千家万户，构建全链路AI落地体系，打造全球最大的物理世界运营中心。

9. Codex自我蒸馏玩法火了！OpenAI员工亲授：复制粘贴就能让AI消灭重复劳动

OpenAI员工Vaibhav Srivastav分享了Codex自我蒸馏的使用方法，通过复制提示词，Codex可自动分析用户历史会话，识别重复任务并生成可复用工具。该功能已迭代至2.0版本，覆盖更广场景，支持Skill、Subagent、Automation等不同形式。提示词依赖Codex新功能如Chronicle、Memory和Subagent，适用于编程、写作、沟通等多种工作类型。OpenAI总裁Greg Brockman转发支持，并提及Codex开源特性。

10. 刚刚，国产Agent模型闯入全球第一梯队！限时免费

国产Agent模型SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite正式发布，性能跻身全球第一梯队，支持主流Agent框架，兼容OpenAI接口，开发者可即插即用。模型以原生Agent训练范式为核心，针对工具调用、多步骤任务处理等痛点进行系统优化，实现高效稳定运行。目前两款模型限时免费开放，价格仅为主流模型的一半甚至更低，并计划逐步开源，推动Agent技术的低成本落地与生态构建。

马斯克宣布xAI的Grok新模型V9-Medium已完成训练，参数规模达1.5T，显著提升编程能力。该模型在训练中引入了Cursor的大量真实开发者数据，以增强代码理解与实际开发场景适应性。同时，Grok Build编程代理工具进入Beta测试，支持多模式操作与扩展功能。此次收购Cursor并整合其数据，标志着xAI在AI编程领域加速布局。

12. 0.9B跑出90%真机成功率！上海交大为VLA补上空间感

上海交大MINT团队提出Evo-Depth模型，通过隐式深度编码提升VLA的空间感知能力，无需额外硬件。该模型参数约0.9B，仿真与真机成功率分别达84.4%-95.4%和90%，部署显存约3.2GB，推理频率12.3Hz。模型采用轻量结构，融合隐式深度信息至视觉-语言通路，兼顾性能与部署效率，为VLA在空间任务中的应用提供了性能-成本-实时性的平衡方案。

13. 刚刚，国产AI自己造了AI，全球首例！

国产AI公司面壁智能首次实现“AI造AI”，推出全球首个由AI自主编写的生产级预训练框架ForgeTrain，性能超越英伟达Megatron。基于此框架训练出的小模型MiniCPM5-1B，在参数量仅为1B的情况下，表现优于多款2B参数模型，展现高智能密度。该模型支持自定义人格，部署灵活，且提供完整工具链，助力端侧应用。此举标志着AI研发进入新阶段，推动大模型效率提升与国产生态发展。

14. 龙虾之父教你省钱：开源Skill给你的Skill减肥

文章介绍“龙虾之父”Peter推出开源工具skill-cleaner，用于优化Skill描述，提升Agent运行效率。核心观点是Skill描述应简洁，避免冗长，以降低token成本和运行延迟。工具提供五项功能：预算审计、重复检测、未使用筛查、根目录审计和描述精简。通过分析技能使用情况，帮助用户清理冗余、优化资源分配，提升整体效率。

15. 画数独、烧蜡烛都不翻车了？浙大&阿里让AI先三思再下笔｜ACL 2026

浙江大学与阿里巴巴团队提出Unified Thinker模型，通过将推理与执行解耦，解决多模态生成模型在逻辑推理任务中的执行鸿沟问题。该模型引入独立的Thinker模块，负责生成结构化、可执行的中间表示，而Generator专注于像素合成，提升生成准确性与逻辑遵循能力。研究构建了包含结构化推理轨迹的数据集，并采用双阶段强化学习优化推理与生成过程，已在多个基准测试中表现优异，具备跨模型迁移能力，推动视觉生成从概率拟合向逻辑导向演进。

16. 量子位编辑作者招聘

量子位招聘编辑、主笔、主编等岗位，涵盖AI产业、财经和产品三大方向，要求具备相关领域知识与写作能力。岗位为全职，工作地点在北京中关村，提供行业资源、专业指导及丰厚薪酬福利。应聘者需提交简历及代表作品，通过邮箱申请。量子位作为AI领域头部媒体，拥有庞大用户基础和行业影响力。

17. 留给人类数学家的悬赏不多了！谷歌DeepMind一口气解决9道埃尔德什问题

谷歌DeepMind推出AlphaProof Nexus，利用Gemini驱动的智能体框架解决9个长期悬而未决的埃尔德什数学问题，包括56年未解难题，同时验证44个猜想和攻克代数几何难题。该系统通过大模型生成证明步骤并结合Lean编译器反馈循环验证，单题成本约几百美元，证明过程涵盖数论、组合几何等领域，展示了AI在数学证明中的强大潜力。

18. 卡帕西Anthropic最新头衔：技术员工（MTS）

Anthropic和OpenAI等AI公司采用“技术员工（MTS）”头衔，旨在扁平化组织、促进技术协作与跨领域创新。该制度有助于防止猎头挖人、增强文化认同及打破部门壁垒，但引发争议，部分人认为其掩盖了实际层级差异。尽管理念先进，但对早期职业者而言，头衔仍是重要职业筹码，引发对制度公平性的讨论。

19. 把VLM塞进隐式世界模型，小鹏机器人新框架让机器人长出物理直觉

小鹏机器人与高校团队提出DIAL框架，通过在VLM原生特征空间中进行隐式世界建模，实现语义推理与物理预测的统一，无需额外生成像素视频。该框架解耦意图与动作，利用两阶段训练提升稳定性和数据效率，在仿真与真实机器人任务中表现优异，展现强泛化与鲁棒性，为具身智能发展提供新思路。

此内容由 AI 自动生成 · 点击标题可查看完整文章

欢迎留言推荐您想要收录的公众号