精选优质公众号,汇总全部文章并由 AI 生成摘要,每日 17:00-18:00 推送
关注本号,每日推送不迷路
共 118 篇文章,来自 23 个公众号
📌 42章经(1篇)
本文探讨了AI技术对软件行业和产品形态的深远影响。随着AI coding工具的普及,个人和小团队能快速创建产品,推动创作群体从传统开发者向更广泛的创作者扩展。未来软件市场可能呈现哑铃结构,顶端为模型公司,底端为分散的OPC(个人或小团队创作)。同时,新的内容形式和情绪价值产品将涌现,但商业化路径仍需探索。社区连接和意义感成为新价值核心,AI虽提升生产力,但真正改变的是创造者与用户之间的连接方式。
- - -
📌 与AI同行之路(1篇)
1. 我把 Claude Code 从聊天框用成了工作流引擎,靠的是这 7 个网站
作者分享了通过7个网站提升Claude Code使用效率的经验。这些网站涵盖技能目录、学习指南、开源模板、官方培训、精选资源、深度教程和开发者社区,帮助用户从基础操作进阶到自动化工作流。核心在于利用外部工具优化交互流程,实现上下文自动携带、代码审查和规范执行,从而提升开发效率。
- - -
📌 stormzhang(1篇)
1. 该文章无标题
一位程序员帮助传统行业朋友通过AI工具提升工作效率,引发对其职业方向的思考。AI虽提升效率,但传统行业仍缺乏相关人才,具备AI能力者可考虑转行至传统行业,以实现高效率、低压力的工作状态。文章指出,传统行业对AI需求迫切,AI从业者有机会在这些领域找到高回报的工作机会。
- - -
📌 AI秘塔(1篇)
1. 最近的一些更新
秘塔AI近期更新视频搜索库,数据规模扩大10倍,搜索深度提升33%,速度翻倍。新增事实核验功能,支持自动核查上传内容中的事实信息,帮助用户高效验证引文、数据等。用户可通过秘塔首页使用该功能,提升信息准确性,适用于学术、教学等场景。
- - -
📌 十字路口Crossing(2篇)
1. 实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?
OmniWork 是一款面向创作工作的 AI Agent 操作系统,旨在通过多个专家协作完成完整作品。实测显示,它能高效执行趋势调研、动画制作和游戏开发任务,实现从零到成品的全流程自动化。系统通过结构化技能和专家分工,提升创作效率,降低技术门槛,未来可能重塑创作工具与服务的边界。
文章探讨了AI时代新兴职业形态FDE(Forward Deployed Engineer)的兴起与特点,指出其不同于传统咨询和软件外包,而是模型公司派工程师深入客户现场,推动模型能力落地。FDE在OpenAI、Anthropic等公司推动下逐渐成为显性岗位,具备较高的薪资和成长空间。文章分析了FDE与传统岗位的区别,强调其对模型边界、客户需求和产品形态的探索能力,并指出适合FDE的人需具备沟通、适应模糊需求、工程力和商业敏感度等特质。
- - -
📌 花叔(2篇)
2024年5月,字节Seed与MIT何恺明团队分别发布Cola DLM和ELF论文,均提出将语言模型从自回归生成转向连续潜空间生成。两篇论文核心在于将离散化操作延后至生成末尾,使模型在连续空间中进行语义推理,再最终输出文本。ELF采用极简设计,仅用基础模型和简单损失函数,显著提升生成效率;Cola则通过分层架构,先生成语义向量再翻译为文本,强调思考与表达的分离。两篇论文虽路径不同,但均挑战了语言模型需在离散空间生成的假设,标志着语言建模范式的重要转变。
作者通过统一多平台视觉形象,意识到品牌对降低交易成本的重要性。借助Lovart工具,他实现了品牌资产导入、字体生成、封面设计、表情包制作、Mockup展示及PSD导出等全流程管理,解决了风格不统一的问题。Lovart以低价格提供专业设计服务,帮助一人公司高效管理品牌视觉,提升专业度与辨识度。
- - -
📌 数字生命卡兹克(2篇)
本文总结了AI时代对人才的六大核心特质:好奇心、靠谱、有事实洁癖、多元化思维、能忍受不确定性、低ego高自驱。作者认为,这些特质比传统技能更具价值,是应对AI快速变化的关键。好奇心驱动持续学习,靠谱建立信任,事实洁癖确保信息准确,多元化思维促进跨领域创新,忍受不确定性适应变化,低ego高自驱则促进自我提升与团队协作。这些特质决定了一个人在AI时代是否具备竞争力。
2. 我折腾了好久的Skills团队共享,终于有产品替我做出来了。
作者分享了在团队中实现Skills共享的困难与尝试,最终发现阿里Accio Work推出了支持团队Skills和Agent共享的企业版功能,解决了小团队协作中Skills同步、版本更新和权限管理等问题。该产品实现了Skills自动更新、团队成员协作与权限管理,为中小团队提供了便捷的Agent协同方案,体现了团队协作在Agent产品中的重要性。
- - -
📌 i 小声读书(2篇)
1. 写给还想抄底恒科的朋友:每次以为要回本,它就再给我一刀
作者分享了五年来持有恒生科技指数ETF的亏损经历,揭示了中概股面临的多重监管、政策风险及市场不确定性。文章指出,尽管恒科曾多次出现反弹,但每次接近回本时都会遭遇新一轮下跌,反映出市场对其风险溢价的持续定价。作者强调中概股的折价并非低估,而是风险的体现,并建议投资者避免加杠杆和融资操作,理性看待中概股投资价值。
2. 港股要变天了
文章分析指出,内地资金撤离对美股影响有限,但对港股尤其是小盘股冲击较大。证监会处罚导致跨境券商客户资金流动,港股通范围外的小盘股面临流动性危机,可能加速“仙化”。港股正逐渐失去独立性,趋于依赖A股市场。建议投资者对港股通核心资产保持持仓,谨慎对待流动性差的小盘股,同时关注跨境投资合规化趋势。
- - -
📌 逛逛GitHub(2篇)
1. 让你的 Claude Code 满血复活,Anthropic 在 GitHub 上开源了个插件。
Anthropic 在 GitHub 开源了官方 Claude Code 插件集合 claude-plugins-official,提供 30 多个内部和 10 多个外部插件,涵盖代码审查、功能开发、遗留系统迁移等功能。用户可通过命令或图形界面安装插件,提升开发效率。推荐插件包括 claude-code-setup、feature-dev、hookify 和 code-modernization,支持自动化配置、结构化开发流程、Hook 管理及代码现代化。项目已获 2 万多星标,开源地址为 https://github.com/anthropics/claude-plugins-official。
2. 同时拿下 Office 文件和飞书、钉钉、企微,办公小浣熊 2.0 来了。
办公小浣熊2.0桌面版推出,主打本地文件直读与企业IM工具(飞书、钉钉、企微)打通,提升AI办公效率。新版本支持文件夹直读、浏览器自动化、全局快捷唤醒、跨平台协作等功能,强化AI在真实办公场景中的执行能力。同时,推出真实任务挑战活动,提供高额奖励,鼓励用户实践AI办公能力。
- - -
📌 老码小张(2篇)
1. 思考的快与慢:用 Prolog 给 LLM 装上理性大脑,然后引入知识图谱,做结构化知识双向同步,这个 agent 能力有点炸裂...
文章提出通过将 Prolog 引擎与 LLM 结合,构建一个具备确定性推理能力的智能代理 Prolog-World。该系统引入知识图谱和规划器,实现结构化知识的双向同步与逻辑推理,弥补 LLM 在逻辑验证和可追溯性上的不足。核心架构分为 System 1(LLM)与 System 2(Prolog+知识图谱+规划器),支持任务规划、语义检索和外部世界交互,提升推理的可靠性与可验证性。项目已开源,适用于需要精确逻辑推理和知识管理的场景。
2. DeepSeek 出了个终端编程 Agent,刚开源 就8.1k Star了,我把代码读完后发现,它真正的壁垒不是 AI,是会计
DeepSeek 新推出的终端编程 Agent Reasonix 开源后迅速获得 8.1k 星标,其核心优势在于深度利用 DeepSeek 的前缀缓存机制,显著降低 API 成本。通过“上下文分区”设计、工具调用修复和成本控制策略,实现高效、低成本的长期运行。与同类工具相比,Reasonix 更注重成本优化而非模型能力,适合终端用户、成本敏感开发者及需长会话工作的场景。
- - -
📌 鲲鹏Talk(2篇)
1. 美团开源了一个能商用的数字人引擎,我试了试觉得有点东西
美团开源了LongCat-Video-Avatar 1.5数字人引擎,支持音频驱动生成高精度唇同步视频,覆盖真人、动漫及动物角色。该模型基于Dense DiT架构,采用Whisper-Large-v3音频编码器,提升自然度与稳定性,并支持多种任务模式及分辨率。开源授权MIT,适用于学术与商用,已通过多场景评测,表现优于部分商业方案。部署需较高硬件配置,但通过量化与蒸馏降低门槛,适合本地化应用与批量生成。
2. 本地 LLM 实战进阶:llama.cpp 服务端完整调优指南(基于 8GB VRAM 硬件的 MoE 模型优化
本文介绍了在8GB显存下运行20B参数MoE模型的优化方法,通过调整llama.cpp的多个关键参数,实现39.5 tok/s的推理速度并保持7GB VRAM占用。核心优化包括ncmoe控制专家分布、启用Flash Attention、使用q8_0格式KV缓存等。文章提供了完整命令、参数作用说明、VRAM计算公式及不同硬件配置建议,强调自行编译的重要性,并给出常见问题的解决方法。
- - -
📌 AGI Hunt(3篇)
1. Anthropic CFO 播客:两年涨120倍,什么因素可能阻碍人工智能革命?
Anthropic CFO Krishna Rao 在播客中透露,公司两年内收入增长120倍至300亿美元,核心驱动力为AI在企业市场的高回报。他强调算力管理、模型自我优化和灵活调度能力是关键,同时指出AI革命可能受制于企业应用扩散速度、scaling laws失效及竞争加剧等因素。Anthropic通过多平台算力部署、内部工具开发和定价策略稳定,持续推动技术前沿,并在安全与伦理方面保持高度关注。
2. Karpathy入职Anthropic后的职称是技术人员
3. 离谱……面壁让 AI 写了个训练框架,然后它自己训出了最强的 1B 模型:MiniCPM5-1B
面壁发布MiniCPM5-1B,成为1B参数量级性能最强的端侧文本大模型,智能指数达17.9。该模型由AI自主编写的训练框架ForgeTrain训练而成,训练速度超越英伟达Megatron。模型支持多种量化部署,可在手机等设备上运行,并在多项基准测试中表现优异。其数据治理方案和AI造AI的研发范式,标志着大模型智能密度持续提升,为国产芯片适配提供了新路径。
- - -
📌 刘小排r(3篇)
2. 在海边工作的真实感受
作者分享了在海边工作的体验,揭示了看似理想的工作环境背后的实际困扰。电脑屏幕反光、防晒帽被风吹走、键盘进沙、海风实为散热口风等细节,展现了海边工作的不便。尽管环境优美,但实际使用电脑并不理想。最终作者建议,到海边不如放下电脑,好好聆听海声。
3. 装厉害税
文章指出,为了获得他人认可而做出的无效努力,被称为“装厉害税”。作者列举了五类典型的“装厉害”行为,如热心指导、朋友圈产品、热词自媒体、面试黑话和火车高谈。这些行为虽能带来短期认可,却阻碍个人成长。文章强调应建立“内部记分卡”,关注自身成长而非外部评价,避免被虚假的认同所困。
- - -
📌 AI寒武纪(3篇)
1. Codex「自我蒸馏」提示词进化版!官方团队给出更强方案,一键打包你的专属工作流
Codex团队推出升级版提示词,通过回顾会话、记忆与日志,识别重复性工作流程,自动创建最小化技能、子代理或自动化。该方案优先复用已有内容,仅针对高频、可重复且有价值的流程进行打包,提升效率与一致性。用户可复制提示词使用,Codex会生成候选清单并推荐合适形式,确保实用、精准且易于验证。
2. 重磅!华为何庭波正式提出τ缩放定律,晶体管密度直指1.4纳米制程,麒麟2026首发验证
华为半导体负责人何庭波在ISCAS会议上提出τ缩放定律,主张以时间常数τ作为半导体演进的核心优化目标,覆盖从晶体管到数据中心的十二个数量级。该定律突破摩尔定律限制,通过LogicFolding等技术实现晶体管密度跃升至238 MTr/mm²,并推动麒麟2026性能提升。τ缩放还应用于AI数据中心,通过统一总线、Hi-ONE和3D折叠等技术大幅压缩通信延迟,提升系统效率。该理论为行业提供统一优化框架,标志着从几何缩放向时间优化的新时代开启。
3. 审美在线、随叫随到、月薪19刀——Lovart把AI设计师这件事做认真了
Lovart 是一款面向非设计背景用户的AI设计工具,提供品牌套件、字体生成、Mock Up、技能自建等功能,帮助用户快速生成风格统一的品牌物料。其核心优势在于稳定的品牌风格输出、一键导出PSD文件及高效编辑功能,适合需频繁制作内容但缺乏设计资源的用户。目前订阅价为每月19美元,性价比高,尤其适合一人公司或品牌运营者。
- - -
📌 AI前线(4篇)
1. 台积电盈利暴涨却大削奖金?员工气愤欲罢工;00后赠母校20亿Token,被质疑仅值几百元;百倍奖金差距致内部分裂,三星HBM产线怠工|AI周报
2. Anthropic 首次揭秘下一代 Claude 怎么造!用户吐槽直接喂模型,连 AI“做梦”都被训练
Anthropic 首次披露下一代 Claude 的发展方向,强调其正从单纯模型升级向具备长期运行、持续协作和稳定判断能力的智能体系统演进。模型研发已产品化,具备明确目标与评测体系,并引入“dreaming”机制模拟人类记忆整理。Claude 逐渐具备人格与价值观,成为数字协作者,提升组织协调能力成为新瓶颈。Anthropic 重视文档文化与内部协作,同时探索模型意识问题,致力于打造更可信、更自然的 AI 协作者。
3. 中国首次提出半导体演进新原则:华为“韬定律”5 年内冲刺等效1.4nm制程,麒麟、昇腾将先后落地量产
中国首次提出半导体演进新原则“韬定律”,以“时间缩微”替代传统“几何缩微”,通过设计优化提升芯片性能。华为基于此定律已量产381款芯片,计划2031年实现1.4nm等效水平,麒麟9040将首发逻辑折叠技术。该定律涵盖器件、电路、芯片、系统多层级优化,助力突破制程瓶颈,推动芯片设计与架构创新成为新性能杠杆。
4. Copilot 创始工程师:大多数 AI 编码“就像开着法拉利去买牛奶一样”
IBM Bob 是由 GitHub Copilot 创始工程师 Neel Sundaresan 推出的智能编码工具,旨在提升开发者效率。他强调 AI 编码工具应聚焦企业实际场景,而非仅追求模型性能。Bob 通过智能模型调度优化成本与效果,避免资源浪费。Sundaresan 认为 AI 应服务于开发者需求,而非盲目追求前沿技术,同时指出智能体应用需规范管理,防止滥用与风险扩散。
- - -
📌 硅星人Pro(6篇)
Cursor 通过构建高效的应用层系统,逐步缩小与原生模型产品的差距,甚至在使用相同模型时实现接近原生的体验。其通过模块化设计,使模型可替换,降低对单一模型的依赖,并借助自研 Composer 模型优化成本结构,实现部分盈利。Cursor 以工程能力为核心,不再依赖模型优势,重新赢得市场信任,展现出在 AI 编程工具领域的竞争力。
2. 用了一个月,我终于明白华为为什么不做 Pura 90 Ultra
华为Pura 90系列在外观、影像和系统体验上表现出色。该系列取消Ultra版本,转而聚焦核心体验,如2亿像素长焦、抗反光屏幕和AI智拍功能,提升实用性和易用性。Pura 90 Pro和Pro Max分别主打日常使用和专业影像,价格合理,产品线清晰。华为通过精简配置,更注重用户真实需求,展现了成熟的产品策略。
3. 一股子 AI 味儿
文章探讨了“AI味”这一现象,指出人们常因文章结构工整、语言规范或内容空洞而怀疑其为AI所写,实则反映的是创作者与读者之间的表达差异。作者通过自身写作经历和案例,强调“AI味”并非标准可定,而是人味的缺失。文章还指出,随意鉴定AI写作会打击真实表达,甚至影响创作生态,呼吁理性看待AI工具,重视内容本身的价值。
宇树科技计划IPO,2025年营收达17亿元,毛利率达60%,主要依赖硬件制造和运动控制技术,暂未涉足AI决策系统。其高毛利源于专注“本体”和“小脑”,而非“大脑”研发,商业模式与长期技术目标存在错位。公司正通过上市融资加大在算法和模型研发上的投入,以突破具身智能瓶颈,实现从硬件厂商向平台型企业的转型。
华为在ISCAS 2026上提出“韬(τ)定律”,主张以“时间缩微”替代传统几何缩微,通过统一优化时间常数τ推动半导体与电子系统演进。该理论在移动SoC和AI系统中实现验证,如LogicFolding技术提升晶体管密度与能效,Hi-ONE光互连降低通信延迟。τ缩放适用于从晶体管到系统的多层级,成为未来半导体发展的新指导原则。
6. “Token”必须死?
文章探讨了大语言模型(LLM)基于token序列的范式是否能通往通用人工智能(AGI)。指出token作为离散符号无法捕捉人类认知的连续性和丰富性,存在结构性天花板。多位专家和机构正转向连续空间建模,如何恺明团队的ELF和字节的Cola DLM,以提升效率与表现。同时,科技巨头如Google、OpenAI、字节跳动等也在探索多模态统一和连续表征。文章认为,token范式可能衰退,但替代方案仍需解决训练信号和探索能力等问题,AGI之路仍充满挑战。
- - -
📌 AI思想会(6篇)
1. 8小时狂揽15K美金!Claude Code屠榜黑客马拉松,开源神器爆15万星
Claude Code开源项目ECC在黑客马拉松中夺冠,凭借智能体优化系统赢得1.5万美元平台额度,并开源后迅速获得15万星标。该项目包含38个智能体、156项技能,通过模块化按需加载机制优化性能,内置安全测试与持续学习功能,助力开发者高效构建AI应用。其开源推动了AI开发的平权化,使独立开发者也能拥有强大工程团队支持。
2. Graphify:为代码库构建知识图谱,以图遍历替代向量检索
Graphify 是一个 Python 工具,通过构建代码库知识图谱,以图遍历替代向量检索,降低查询成本。其核心在于利用 AST 提取结构化关系,结合语义分析处理非代码内容,并通过置信度标签区分信息来源。适用于混合媒体项目和复杂调用图场景,但对小型项目或依赖语义搜索的仓库效果有限。
3. AI能预测科学突破吗?CUSP基准揭示前沿模型能力边界
AI能否预测科学突破?来自多机构的联合团队提出CUSP基准,首次在受控时间知识约束下评估AI的科学预测能力。该基准涵盖4760个科学事件,从可行性判断、机制推理到时间预测四个维度测试模型表现。研究发现,当前AI在判断科学进展是否实现、何时实现及生成方案方面存在系统性局限,尤其在时间预测和不确定性估计上表现不足,且性能在不同领域差异显著。这表明AI在科学预测任务上仍面临根本性挑战,需进一步提升前瞻性推理与不确定性校准能力。
4. GPT-5.6泄露了!
GPT-5.6疑似泄露,内部代号为iris-alpha,具备150万上下文窗口和极简UI设计,展现强大前端生成能力。其多步推理和智能体工作流升级引发行业关注,OpenAI、Anthropic、Google及马斯克团队均加速布局,6月或迎来大模型集中发布,标志着AI领域进入激烈竞争阶段。
5. 不给现金,只给超3亿美元Token!Sam Altman开始“拿算力换股份”:向169家YC公司发200万美元Token,但要拿股权来换
OpenAI通过向169家YC创业公司提供价值200万美元的Token,换取其股权,旨在绑定AI创业生态。Token可用于调用GPT模型等AI能力,替代现金支持创业公司开发产品。此举被视作OpenAI以低成本资源换取长期股权,并推动创业公司依赖其生态。争议在于Token是否值得用股权交换,以及OpenAI是否可能复制创业公司产品。
6. 在地球上探测到暗物质迹象?黑洞当放大镜,MIT等新模型从引力波中找出「可疑印记」
MIT与欧洲研究人员提出新模型,通过分析引力波波形,尝试在黑洞合并信号中寻找暗物质的印记。他们预测,若暗物质存在于黑洞周围,其引力波信号将呈现特定特征。研究团队将模型应用于LIGO-Virgo-KAGRA观测数据,发现信号GW190728可能包含暗物质印记,但尚未确认。该研究为利用引力波探测暗物质提供了新方法,有助于更精确地探索宇宙中不可见的物质成分。
- - -
📌 AI科技评论(6篇)
贝塔无限创始人刘武龙凭借华为十余年AI系统工程经验,创立具身智能公司,已完成数亿元融资。他主张融合自动驾驶、大模型与机器人技术,构建“具身大脑”系统,强调系统工程思维与商业化落地。面对行业技术路线分歧,他提出“四维一体”架构,主张分层控制与持续优化,重视真实场景数据与用户交互体验。他认为具身智能终局在于系统闭环与个性化服务,而非单纯技术堆叠。
X-Era的EonWorld在WorldScore和WorldArena榜单上连续夺冠,展现出卓越的三维结构稳定性和物理预测能力。该模型基于VWA原生世界动作体系,不仅关注画面生成质量,更强调模型对世界变化的理解与动作决策的支持。其成绩标志着世界模型正从“生成像”转向“能用”的关键阶段,为机器人理解世界并执行任务提供了更坚实的基础。
3. 独家丨天机智能完成10亿元B轮及B+轮融资,估值近百亿,高瓴、美团联合领投
天机智能完成10亿元B轮及B+轮融资,投后估值近百亿元,高瓴、美团联合领投。公司专注于具身智能底层技术,打造力控人形双臂,已实现量产交付并覆盖全球45家头部厂商。其自研传感器与控制架构性能领先,最新产品单臂自重仅8kg。本轮资金将用于加强核心技术、提升产能及拓展海外市场,推动其成为具身智能产业链关键环节。
4. 港中文李鸿升团队论文 MindVLA-U1:VLA 不再输给 VA,语言真正进入自动驾驶决策
港中文李鸿升团队提出MindVLA-U1,通过统一视觉语言动作架构,实现自动驾驶中语言理解与动作规划的深度融合。该模型结合Intent-CFG与流式记忆机制,提升轨迹生成精度与语义可控性,在WOD-E2E基准测试中表现优异,验证了VLA在复杂场景下的优势。研究探索了快慢推理路径,兼顾实时性与安全性,为自动驾驶决策系统提供了新的架构方向。
5. 1B 参数跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自进化,提速 AGI 进程
面壁智能发布全球首个由AI创造的基座模型MiniCPM5-1B,以1B参数实现超越2B模型的性能表现。该模型通过“AI制造AI”的自进化范式,重构了模型、框架与数据的协同体系,大幅降低研发成本与周期。MiniCPM5-1B在多个评测中表现优异,具备端侧部署能力,支持多种精度压缩,推动AI研发向工业化、自进化方向发展,助力AGI进程提速。
6. 从「时域建模」到「频域融合」:中山大学团队为传感器人体活动识别提供新思路 | TPAMI 2026
中山大学团队在IEEE TPAMI 2026发表的研究提出TSF框架,通过三重频域融合(傅里叶域、图傅里叶域、小波域)突破传感器人体活动识别(HAR)瓶颈。该方法从物理机制出发,针对IMU传感器噪声特性进行自适应滤波与特征提取,有效提升识别精度,同时降低参数量与计算复杂度,展现良好可解释性。实验表明TSF在多个数据集上表现优异,为HAR领域提供新思路。
- - -
📌 极客公园(8篇)
1. 「死了么」App 被「收编」,改名「在么在么」;台积电盈利大增却传出削减奖金,员工酝酿罢工;NVIDIA 杀入 CPU 市场 | 极客早知道
神舟二十三号航天员成功进驻中国空间站,实现第八次“太空会师”。NVIDIA推出Vera CPU,预计在性能和密度上超越x86芯片,与Intel在Computex展开竞争。台积电盈利增长但传出削减奖金,员工酝酿罢工。杭州“在么在么”App升级用于独居老人监测,AI生成文章数量已超人类。AI领域融资总额超1100亿元,国产大模型融资激增。新型全息3D打印技术效率提升70倍。科大讯飞发布新款智能办公本,支持离线AI功能。苹果iOS 27将优化AirPods设置界面。企业强推AI提效却面临成本过高问题。
2. 具脑磐石完成亿元融资,前华为具身一号位押注 JEPA 具身路线
具脑磐石完成亿元级融资,采用JEPA架构构建认知世界模型,探索低数据、高泛化、终身学习和低功耗的具身智能新路径。公司以类脑智能为底层范式,强调算法创新而非单纯依赖数据和算力,旨在突破现有具身智能的结构性瓶颈。创始人朱森华曾任职华为,具备跨学科背景,团队具备商业化落地能力,已在多个场景开展验证。公司聚焦于认知模型与真实场景结合,推动技术从实验室走向实际应用。
3. Gemini 3.5 Flash 实测:当模型速度进入 4G 时代,Agent 的游戏规则变了 | AI上新
Google 在 I/O 大会上推出 Gemini 3.5 Flash,其响应速度达 289 tokens/秒,首 token 延迟仅 65 毫秒,显著优于同类模型。实测显示,Gemini 在 Agent 场景下表现突出,尤其在长程任务和代码生成效率方面优势明显,虽在部分测试中表现稍逊,但整体速度优势使其在实时交互和任务处理效率上实现质变,标志着模型体验进入“4G 时代”。
阿里云在520峰会上推出Agentic Cloud体系,重构技术栈以适配Agent需求,涵盖芯片、云能力、大模型和推理平台。重点推出Qwen3.7-Max模型、百炼平台及56款产品Skill化,提升Agent任务调度与资源管理能力。同时推出新官网千问云,聚焦模型调用与Agent交互体验。阿里云正从传统云服务向Agent驱动的商业化转型,重新定义云的价值衡量标准。
5. 微软按下 vibe coding 暂停键:烧 token 已经比员工贵了
微软取消内部 Claude Code 许可,因 AI token 成本过高,远超员工薪资。此举反映 AI 替代人力的经济模型面临挑战,token 费用随使用量增长而激增,导致企业成本结构失控。YC 则主张通过 AI 替代人力,将 token 视为资产替代,而非单纯支出。文章指出,AI 与组织结构的匹配是关键,传统公司难以承受 AI 带来的成本压力,而 AI-native 公司则通过重构资产形式实现效率与成本平衡。
6. 打破光刻工艺束缚,华为提出「韬定律」;宇树科技将于 6 月 1 日接受科创板上市审核;追觅官宣 C 罗出任全球代言人 | 极客早知道
华为提出“韬定律”以“时间缩微”替代传统光刻工艺,推动芯片技术发展;宇树科技将于6月1日接受科创板审核,其人形机器人实现全球商用落地;谷歌承认Gemini在AI编程领域落后,OpenAI在新加坡设立首个海外AI实验室;追觅官宣C罗为全球代言人;中科宇航力箭一号火箭拟执行“一箭八星”任务;法拉利发布首款纯电动车Ferrari Luce;逐际动力发布具备27自由度的人形机器人LimX Luna;OPPO Reno16系列推出真3D悬浮工艺手机;首个全自动AI科学家Robin两小时发现致盲眼病新药。
7. 对话奇点光子谢崇进:当英伟达用 45 亿美元,「烧」火了赛道
AI算力增长推动光互连成为关键领域,英伟达投资加速行业热度。奇点光子创始人谢崇进凭借三十年光通信经验,聚焦当前客户需求,推出高密度光芯片产品,采用NPO/CPO封装方案,兼顾性能与量产能力。公司不押技术终局,而是瞄准2027年前市场窗口,专注解决超算中心GPU互联难题,定位为关键部件供应商,不与大厂竞争系统方案,而是为云厂商、GPU厂商等提供可集成的光互连芯片,助力AI算力升级。
8. 不止于Copilot:医渡科技超级智能体,想做医疗界的Claude Code
医渡科技通过12年医疗数据积累,构建了嵌入诊疗流程的智能体系统,实现AI在医疗场景中的深度应用。其架构融合通用大模型与医疗专用模型,支持循证、可追溯、可审查的智能决策。通过嵌入医生工作流,实现智能体与医生协作,提升诊疗效率并推动商业化落地。目前已在三甲医院实现高渗透率,2026年预计实现全年盈利,标志着医疗AI在生产力变革上的突破。
- - -
📌 InfoQ(9篇)
微软因Claude Code成本过高而叫停其在内部工程师中的使用,转向自家GitHub Copilot CLI。此举不仅出于成本考量,也是一场内部测试,旨在通过对比提升自身产品。微软面临三大困境:缺乏自研通用大模型、产品力不敌竞品、生态控制权减弱。随着Anthropic和OpenAI的崛起,微软在AI领域的主导地位受到挑战,其依赖外部模型的模式正遭遇利润和控制力的双重流失。
2. Copilot 创始工程师:大多数 AI 编码“就像开着法拉利去买牛奶一样
IBM Bob 是由 GitHub Copilot 创始工程师 Neel Sundaresan 领导开发的智能编码工具,旨在提升开发者效率。与当前 AI 编码工具不同,Bob 聚焦于代码自动补全与推荐,而非生成代码。Sundaresan 强调用户体验与模型性能的分离,主张根据任务需求智能调度模型,避免资源浪费。他指出多数 AI 工具被滥用,如用顶级模型处理简单任务,成本高昂且不必要。IBM 内部的庞大用户群体和多样化工作负载为 Bob 提供了独特优势,使其能适应复杂企业场景。
3. 大规模工程支撑场景下的多智能体系统设计:Grab 实践案例
Grab 推出多智能体系统,用于自动化数据平台中的运维支持工作流,减少重复性任务,提升问题解决效率。系统分为调查与增强两大工作流,分别处理问题诊断与代码生成。采用 LangGraph 和 FastAPI 构建,整合工具生态,优化上下文管理与安全性。该系统有效释放工程人力,推动团队从应急处理转向系统构建。
4. Anthropic 推出 MCP 隧道,供私有代理访问内部系统
Anthropic 推出 MCP 隧道和自托管沙箱功能,以增强企业使用 Claude Managed Agents 的安全性与控制力。MCP 隧道允许代理连接私有系统而无需公网暴露,通过加密出站连接实现安全访问。自托管沙箱支持多种托管服务,使企业能自主管理计算资源与数据驻留。两项功能旨在满足企业在安全边界内运行 AI 代理的需求,提升部署效率与合规性。
5. 中国首次提出半导体演进新原则:华为“韬定律”5 年内冲刺等效1.4nm制程,麒麟、昇腾将先后落地量产
中国首次提出半导体演进新原则“韬定律”,以时间缩微替代传统几何缩微,提升芯片性能。华为基于此定律已量产381款芯片,预计2031年实现1.4nm等效水平。麒麟9040将首发逻辑折叠技术,提升晶体管密度与性能。该技术通过设计优化降低信号延迟,突破制程限制,推动芯片设计与系统架构成为新性能杠杆。
文章指出,George Hotz认为将AI Agent引入软件开发可能成为历史上代价最重的错误。他通过实践发现,AI生成的代码质量差且难以察觉,无法替代程序员。文章提到,AI在提升效率的同时也带来代码质量下降、维护困难等问题,尤其在大型组织中影响更严重。此外,部分公司已出现AI使用成本高、产出不匹配的困境,引发对AI编程工具大规模应用的担忧。
7. Coding Agent 在百度的落地实践:从反馈闭环到工程范式重构
百度在Coding Agent的落地实践中,通过构建反馈闭环、Benchmark评测和Agent Engineers体系,有效应对了模型快速迭代带来的架构挑战。Comate团队实现了用户每周人均Query次数达90余次,Agent应用覆盖非开发者和开发者,支持代码探索、调试和功能实现等场景。通过双层Loop架构、异常值评测、任务复杂度分析和工具执行网络等工程实践,提升了Agent的稳定性与效率。同时,推动全员转型,打破角色边界,强化人与Agent的协作,实现全栈能力提升与高效交付。
8. 上下文窗口限制被打破:Subquadratic推出了一个1200万Token的窗口
Subquadratic 推出一款支持 1200 万 Token 上下文窗口的模型,宣称其 SSA 架构在计算和内存上与上下文长度呈线性增长,相较密集注意力效率提升显著。该模型在多个基准测试中表现优异,如 MRCR v2 得分 83,超越 OpenAI 模型。公司计划推出 5000 万 Token 版本,并通过 API 和代理工具提供服务,但尚未开源权重。
9. OpenAI 详解规模化低延迟语音 AI 的 WebRTC 架构
OpenAI 介绍了其为实现全球低延迟语音 AI 所采用的 WebRTC 架构调整。新架构采用中继收发器模型,将 WebRTC 会话状态集中于收发器层,利用轻量级中继减少 UDP 暴露并优化媒体路由。该方案解决了传统架构在 Kubernetes 环境中的运维难题,通过职责分离,避免复杂逻辑分散,提升系统稳定性和可扩展性。此架构已应用于 ChatGPT 语音和 Realtime API 等产品。
- - -
📌 机器之心(15篇)
1. 还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速
CODA 是一项新研究,提出将 Transformer 中的内存密集型操作通过数学重写,整合到 GEMM 内核的尾声阶段,以减少显存访问开销。该方法支持人工和 AI 生成代码,实现高效内核编写。实验显示,CODA 在多个算子和模型规模上均优于现有优化方案,尤其在反向传播中提升显著。目前支持单 GPU 场景,适用于标准 Transformer 架构。
2. RSS 2026|机器人别等失败了才补救,AgentChord让恢复动作提前写进任务图
机器人操作面临复杂环境下的失败风险,传统方法依赖事后补救,存在延迟和效率问题。香港中文大学(深圳)等团队提出AgentChord系统,通过在任务图中提前编排恢复动作,实现失败前的主动应对。该系统将任务、失败与恢复整合至同一图结构,利用三个智能体协同完成任务规划与恢复编排,提升执行稳定性与效率。实验表明,AgentChord在仿真与真实环境中均表现出色,成功率和执行时间优于现有方法,为机器人操作提供了更可靠的恢复机制。
3. Claude 通过率不到 4%,SaaS-Bench 撕碎了 Computer-Use 的「全自动办公」幻想
SaaS-Bench 测试显示,当前 AI Agent 在处理真实办公任务时表现不佳,通过率不足4%。测试涵盖23个真实SaaS系统,任务涉及跨应用、长流程操作,揭示Agent在持续状态推理、错误恢复和闭环验证方面存在结构性缺陷。结果显示,多数模型无法完成复杂任务,且执行不稳定,暴露出“全自动办公”幻想与现实之间的巨大差距。
4. 从「说错话」到「干错事」:复旦、CityUHK、SMU、UIUC等13家机构联合发布「具身智能安全」综述
多所高校与研究机构联合发布《具身智能安全》综述,指出随着具身智能系统从实验室走向现实,其安全风险由“说错话”升级为“干错事”。综述提出“能力—风险”二象性理论,认为系统能力越强,攻击面越广,风险越严重。文章梳理了具身智能五层能力栈中的攻击面与威胁,并强调需从整体视角设计安全机制,而非事后补救。
5. 性能超越李飞飞,他们把10亿高斯点的3D世界装进浏览器
李飞飞团队与群核科技联合推进3D高斯技术,群核开源的Aholo Viewer在渲染速度和大场景加载性能上超越Spark 2.0,支持10亿高斯点的超大3D场景流畅运行。该技术通过Chunk-based LOD Tree优化,实现内存减半、加载快1倍、渲染快3倍,推动互联网从二维向三维内容转型,为AI理解物理世界提供关键数据支持,标志着空间智能成为下一代互联网基础能力。
6. 告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成
中国科学技术大学等机构联合提出Flow-OPD框架,首次将在线策略蒸馏应用于流匹配模型,解决多任务训练中的梯度冲突与能力衰退问题。该方法通过多教师OPD蒸馏,结合动态任务路由与流形锚点正则化,实现文本渲染、图像质量等多维度性能的全面提升。实验表明,Flow-OPD在多任务联合优化中表现出色,展现出超越单一专家模型的潜力,为构建通用视觉生成模型提供了新范式。
7. 一个问题几百美元,DeepMind智能体一次搞定了9个Erdős问题
DeepMind 的 AI 智能体通过 AlphaProof Nexus 框架,成功解决了 9 个长期未解的 Erdős 数学问题,涵盖数论、组合数学等领域。该方法结合大模型的创造力与 Lean 编译器的严谨性,实现自动解题与验证,成本控制在数百美元内。研究展示了 AI 在数学研究中的潜力,并为未来智能体架构设计提供了新思路。
8. VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架
VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架,支持扩散与全模态模型,如 Qwen-Image、Qwen-Omni 等。该框架集成 vLLM-Omni 实现高效多模态 rollout,支持异构流水线与复杂负载调度,并提供灵活的奖励引擎和模块化训练后端。通过异步高吞吐生成与奖励计算重叠,显著降低训练延迟。同时兼容 NVIDIA GPU 和昇腾 NPU,支持多种训练策略与算法扩展,旨在推动高效多模态 RL 训练发展。
9. 并购激励金都不要了?全程踩中AI Coding,Windsurf核心工程师离开DeepMind
Ronak Malde 从 Codeium 到 Windsurf,再加入 DeepMind,现选择离职并放弃并购激励。他参与开发了 SWE-1 和 Antigravity 等关键项目,认为 AI 研究应聚焦正确方向,团队需高效决策与快速迭代。他强调 AI Coding 领域人才流动频繁,未来将继续探索新方向,推动行业变革。
10. 解码加速15倍!EdgeRazor助推大模型在PC/移动端“狂飙”
EdgeRazor 是由南京大学与微软联合推出的开源工具库,通过混合精度量化感知蒸馏技术,解决了端侧部署大模型的“不可能三角”问题。该框架在极低比特下保持高性能,实现15倍推理加速和显著压缩比,支持灵活训练数据配比,适用于PC、手机等资源受限设备,为大模型轻量化部署提供了高效、低成本的解决方案。
11. 后OpenClaw时代!国产Agent模型凭「高配低价」叫板Opus 4.6
国产Agent模型SkyClaw-v1.0发布,凭借高性能与低成本优势,挑战OpenClaw等主流模型。该模型在智能体能力、使用门槛和性价比三方面表现突出,支持复杂任务处理与多平台适配,限时免费开放体验,为开发者提供更高效、易用的Agent解决方案。
12. ACL 2026|证据摊开看,场景图画清:让流式视频大模型拿捏「何时开口」
ACL 2026上,研究团队提出Response-G1框架,通过显式场景图建模,解决流式视频大模型在主动交互中“何时开口”的难题。该方法将视觉证据与响应条件结构化对齐,提升模型对响应时机的判断能力。实验表明,在主动与被动任务中均取得显著性能提升,为流式视频理解提供了更可解释、可调试的解决方案。
13. 不用人类手写训练框架了!AI自己写代码,训出1B端侧「小钢炮」
面壁推出1B参数端侧大模型MiniCPM5-1B,主打低成本部署与高效运行,支持本地化应用。该模型在同尺寸中表现突出,超越多款主流模型,且由AI自动生成的训练框架ForgeTrain训练完成,提升训练效率。模型提供多种量化版本,适应不同设备部署,推动端侧AI发展,标志着AI制造AI的实践落地。
xAI解散后,Grok仍持续发展。马斯克宣布Grok V9-Medium模型已完成训练,参数量达1.5T,性能优于前代,并针对Blackwell架构优化。该模型将在两周内发布,支持复杂编程任务。同时,马斯克收购Cursor获取真实开发者数据,提升模型实用性。新推出的Grok Build作为编程智能体,具备计划模式、并行子智能体等功能,加入终端编程智能体竞争。目前其底层模型仍有提升空间,未来表现值得关注。
15. ACL 2026 Main | 不只是调用地图API,Spatial-Agent让大模型生成可执行地理分析工作流
Spatial-Agent 是一种基于地理分析工作流的LLM代理框架,旨在将自然语言问题转化为可执行的GeoFlow Graph,以解决复杂的地理空间任务。该方法引入空间概念和功能角色,结合预定义模板,确保分析流程的正确性与可验证性。实验表明,Spatial-Agent在多个基准测试中显著提升性能,验证了其在地理分析任务中的有效性。
- - -
📌 新智元(18篇)
1. 8小时狂揽15K美金!Claude Code屠榜黑客马拉松,开源神器爆15万星
旧金山开发者Affaan Mustafa利用Claude Code构建了包含38个智能体、156项技能的系统,开源后迅速获得15万星标。他在黑客马拉松中凭借该系统夺冠,并推出AI客户调研平台Zenith,帮助创业者验证创意。该项目开源后因模块化设计、高效资源管理及安全机制广受关注,体现了AI智能体在开发流程中的强大赋能作用。
2. 前DeepMind华人研究员离职喊话:AI行业所有人都搞错了方向
前DeepMind研究员Lun Wang离职后指出,AI行业当前最大的瓶颈并非算力或数据,而是评估体系。现有基准测试、安全评估和红队测试均假设模型只是当前版本的增强,若模型进入全新能力区间,评估体系将失效。他强调,评估是训练和安全的上游基础,错误的评估会导致训练目标偏差,进而影响模型行为。真正的挑战在于如何预测并评估未知能力,目前尚无有效解决方案。
Claude推出「双记忆系统」,包含「文件记忆」与「梦境」功能,实现持久、结构化记忆管理与自动整合。新功能支持无限扩展、按需检索,并通过「Dreams」模拟人类REM睡眠机制优化记忆。同时,Conway作为7x24小时运行的AI平台亮相,标志着Claude在持久记忆生态竞争中迈出关键一步,为未来AI发展奠定基础。
华人数学家张欣攻克困扰数学界50年的Zaremba猜想,其成果基于导师Alex Kontorovich早期研究,并借助Ilya Shkredov近期突破性成果完成。该猜想涉及连分数展开中部分商的上限问题,对数值积分和伪随机数生成有重要意义。张欣通过系统性积累与关键拼图的结合,成功证明了猜想对所有正整数成立,标志着数论领域的重要进展。
5. Claude不到4%,全军覆没!一场大考撕碎Agent「全自动办公」幻想
SaaS-Bench测试显示,当前AI Agent在真实办公场景中表现不佳,多数任务无法完整执行。测试覆盖23个真实SaaS系统,任务涉及多应用、长流程和多模态操作。结果显示,最强模型Claude Opus 4.7仅完成4个任务,整体通过率极低。测试揭示Agent存在四大结构性缺陷:任务越长越易出错、错误扩散、缺乏自我检查和执行不稳定,暴露了其在长程任务中缺乏全局状态推理和闭环验证能力,表明Agent距离真正实用仍有较大差距。
6. 30天烧掉60万亿,扎克伯格没进前250:大厂AI沦为KPI游戏
亚马逊和Meta等大厂内部推行AI使用排行榜,导致员工为提升token消耗量而刷AI,形成“tokenmaxxing”现象。尽管公司声称不考核,但管理层压力促使员工过度使用AI工具,实际产出与token消耗不成正比。Jellyfish数据显示,高token用量并未显著提升效率,反而增加成本。这种行为背后是资本对AI基建投资的背书,但也引发对激励机制扭曲效率的担忧。
7. 胜率直逼人类大师!这套Agent揭开中国AI「玄学真相」
Tianfu Agent在无信息泄漏的术数专业题库测试中,准确率提升至50%,接近人类Top20选手水平。该系统通过多Sub-Agent协作、工具分级管理及不确定性量化机制,有效提升推理能力。研究展示了垂直领域Agent开发的工程经验,包括工具封装、动态注入与置信度评估,对类似领域具有参考价值。
8. 刚刚,Ilya又发神图「思考者」!AI芯片海洋上在想啥?
Ilya在Instagram发布一幅以《思考者》为灵感的Die Shot图,引发广泛关注。画面中思考者站在芯片微观结构上,隐喻AI与硅基技术的融合。同期,OpenAI在数学、Codex功能及IPO计划上取得多项突破,释放AGI临近的信号。文章指出,Ilya通过艺术与技术结合,暗示AI正推动范式跃迁,AGI或已进入现实变量。
新智元面向2026年ASI奇点之年,招募ASI架构师与主笔,年薪50-70万,工作地点在北京上地。岗位要求具备AI技术能力与内容创作经验,分别负责工程落地与深度报道。公司强调全球AI前沿洞察与内容质量,提供顶级AI工具与行业影响力平台,吸引有使命感的同行者共同推动ASI时代发展。
10. GPT-5.6泄露了!
GPT-5.6意外泄露,展现150万Token上下文窗口和极简神级UI,引发AI界震动。OpenAI加速迭代,计划6月发布,与Anthropic、Google等竞相发力,推动6月成为大模型爆发期。模型在多步推理和智能体工作流上实现重大升级,预示AI军备竞赛加剧。
谷歌DeepMind推出的AlphaProof Nexus AI数学智能体,一次性解决了9道长期未解的Erdős开放问题,其中最老的悬而未决56年。所有证明均通过Lean编译器形式化验证,确保无误。该系统融合了大语言模型、AlphaProof和进化算法,采用多层级架构协同工作,实现高效、准确的数学证明。
12. 一个月的活一周干完!英伟达世界模型训练速度飙升400%
英伟达发布的世界动作模型DreamZero在两项机器人基准测试中表现优异,但训练周期长、成本高。无问芯穹联合清华推出的RLinf框架通过算子优化、FSDP2并行策略、I/O加速等手段,实现近4倍训练吞吐提升,使原本需25天的训练缩短至约6天,显著降低学习成本,推动具身智能领域高效迭代。
13. 算法1年翻倍,芯片2年翻倍?重磅实锤:AI正在自我加速,拦不住了
NBER最新研究显示,AI研发正形成远超其他科技领域的自我加速反馈环,芯片效率每2年翻倍,算法效率每年翻倍,叠加后推动AI算力指数增长。论文指出,即使部分自动化也能打破人类瓶颈,当研发自动化率达13%时,将触发奇点式爆发增长。模型预测,6年内AI可能实现自我迭代,进入由AI主导的快速发展阶段。
14. AI公司烧不起Token了!国产Agent杀出,逼近Opus 4.6还免费
AI公司面临高昂Token成本压力,Token已成为AI时代的“电力消耗”。SkyClaw-v1.0作为高性能Agent模型,性能接近DeepSeek V4 Pro和Claude Opus 4.6,价格仅为行业主流的一半甚至更低,并提供限时免费体验。该模型支持多场景应用,如生成PPT、开发小红书风格App和中国象棋游戏,显著提升效率与性价比。SkyClaw通过三阶段训练体系强化Agent能力,推出轻量版Lite满足不同需求,推动AI技术普惠化,助力企业降低Token成本,实现高效落地。
15. OpenAI差点没了?总裁亲述:奥特曼被罢免当天,我就辞职了
OpenAI总裁Greg Brockman在播客中首次披露2023年11月奥特曼被罢免的72小时危机。当时董事会未给出明确理由,导致Brockman辞职,引发员工请愿支持。危机暴露了公司治理结构的脆弱,最终在核心成员支持下,奥特曼回归,公司重建。Brockman强调OpenAI的使命是造出有益于人类的AGI,并将未来赌注放在持续研发模型的系统和算力上。
16. 新智元ALL in ASI英雄帖
新智元面向2026年ASI奇点之年,招募ASI架构师与主笔,年薪50-70万,工作地点在北京上地。岗位要求具备AI技术能力与内容创作经验,分别负责工程落地与深度报道。公司强调全球AI前沿洞察与内容质量,提供顶级AI工具与行业影响力平台,吸引有使命感的同行者共同推动ASI时代发展。
17. 马斯克曝光Grok 5!1.5万亿参数,偷师Cursor狂练编程
马斯克宣布Grok V9-Medium训练完成,参数达1.5万亿,是现役模型的三倍,并整合了Cursor的编程交互数据以提升编程能力。该模型将与Grok Build编程Agent一同发布,标志着马斯克在AI编程领域的全面布局。尽管参数规模扩大,但实际效果仍需观察,当前Grok在企业采用率和基准测试中仍落后于竞争对手。马斯克此举或为SpaceX上市及AI竞争做准备。
18. 马斯克甩出两张王牌,Grok Build杀入AI编程
马斯克旗下xAI推出Grok Build,作为编程智能体CLI工具,旨在弥补在AI编程领域的短板。该工具面向更多用户开放,并基于性能更强的Grok V9模型,参数规模提升三倍,同时优化了硬件架构。V9通过补充训练引入Cursor数据,提升编程能力,但其实际效果仍需实测验证。Grok Build支持任务规划与执行,具备扩展性,标志着xAI在编程智能体产品线上的重要进展,即将与Claude Code、Codex等展开竞争。
- - -
📌 量子位(19篇)
1. 卷到今天,Agent的含金量还在提升丨AIGC2026圆桌论坛
2026年Agent产品进入爆发期,从概念走向实际应用,产品形态逐渐清晰,迭代节奏加快。嘉宾认为,Agent将从工具转向托付,需建立用户信任,同时面临技术快速迭代带来的决策挑战。未来Agent将更偏向商用和OPC场景,用户群体向B端和D端转移,创业机会仍存在,关键在于找到差异化定位并快速行动。
2. 华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资
华为旗下“具身大脑一号位”朱森华创立的具脑磐石,聚焦认知科学与AI结合,打造类脑认知世界模型,完成亿元级融资。公司致力于构建能理解物理世界、预测行动后果、持续学习的机器人“大脑”,通过五层架构实现从感知到主动推理的完整链路。其技术路线对标JEPA,强调低数据、高泛化、终身学习与低功耗,团队具备AI与脑科学交叉研究背景,推动具身智能从理论走向商业化落地。
3. DeepSeek V4还能更省!新工具缓存命中率高达99.82%,2折稳定到手
DeepSeek V4新工具Reasonix通过高缓存命中率(99.82%)大幅降低使用成本,将原本414元的账单降至81元。该工具专为DeepSeek设计,采用缓存优先循环和工具调用修复机制,优化长会话效率并自动切换模型以控制成本。项目提供简单安装方式,且强调其非通用性,仅针对DeepSeek功能构建。
4. 图灵奖得主领衔,中国大模型第一梯队集结!2026智源大会,看懂AI下一程
2026智源大会汇聚图灵奖得主与中国AI领军者,聚焦智能体与世界模型两大趋势,探讨AI在真实世界中的应用与挑战。大会涵盖25场论坛,涵盖Agent、具身智能、安全等前沿方向,推动AI从技术到产业的全面落地。同时关注AI教育与生产关系变革,展现中国大模型第一梯队的创新力量与未来方向。
5. 量子位编辑作者招聘
量子位招聘编辑、主笔、主编等岗位,涵盖AI产业、财经与产品三大方向,工作地点在北京中关村。岗位面向社招与校招,提供丰富的职业发展机会和行业资源。应聘者需具备相关领域知识与写作能力,可提交简历及代表作品。量子位作为AI领域头部新媒体,拥有庞大用户基础与行业影响力。
6. “VLA和世界模型都不是终局,会有物理世界独有的模型” | 蚂蚁灵波沈宇军@AIGC2026
大模型依赖互联网数据红利,但机器人进入物理世界面临数据空白。蚂蚁灵波沈宇军提出AIGA概念,强调从内容生成转向动作生成。他认为VLA和世界模型并非终局,未来将融合形成物理世界独有的模型。数据标准化和空间感知是关键,预计2028年前后,具身智能将进入普及阶段,人人可为机器人提供数据,实现类似ChatGPT的突破。
AI宠物翻译器PettiChat预售2万单,售价800多元,能将猫狗叫声实时翻译成文字并实现双向对话,准确率达95%。产品具备情绪识别、音色克隆、位置追踪等功能,通过大模型分析叫声特征,推测宠物意图。尽管其翻译准确性存疑,但为宠物与人类沟通提供了新方式,引发市场关注。
8. 京东JoyInside戴文军:AI的终极形态不是聊天,是融入你家每一件物品丨AIGC2026
京东科技JoyInside业务负责人戴文军在AIGC2026峰会上提出,AI的终极形态是深度融入物理世界的“AI World”,未来硬件将像人一样主动感知并满足用户需求。他强调,AI应从数字空间走向线下,通过“附身智能”技术,将AI植入家居、机器人等设备,提升家庭生活体验。京东依托大模型、供应链与产业场景,推动AI从千行百业走向千家万户,构建全链路AI落地体系,打造全球最大的物理世界运营中心。
9. Codex自我蒸馏玩法火了!OpenAI员工亲授:复制粘贴就能让AI消灭重复劳动
OpenAI员工Vaibhav Srivastav分享了Codex自我蒸馏的使用方法,通过复制提示词,Codex可自动分析用户历史会话,识别重复任务并生成可复用工具。该功能已迭代至2.0版本,覆盖更广场景,支持Skill、Subagent、Automation等不同形式。提示词依赖Codex新功能如Chronicle、Memory和Subagent,适用于编程、写作、沟通等多种工作类型。OpenAI总裁Greg Brockman转发支持,并提及Codex开源特性。
国产Agent模型SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite正式发布,性能跻身全球第一梯队,支持主流Agent框架,兼容OpenAI接口,开发者可即插即用。模型以原生Agent训练范式为核心,针对工具调用、多步骤任务处理等痛点进行系统优化,实现高效稳定运行。目前两款模型限时免费开放,价格仅为主流模型的一半甚至更低,并计划逐步开源,推动Agent技术的低成本落地与生态构建。
11. Grok最新模型吃上Cursor「加餐」,马斯克:Coding实现巨大改进
马斯克宣布xAI的Grok新模型V9-Medium已完成训练,参数规模达1.5T,显著提升编程能力。该模型在训练中引入了Cursor的大量真实开发者数据,以增强代码理解与实际开发场景适应性。同时,Grok Build编程代理工具进入Beta测试,支持多模式操作与扩展功能。此次收购Cursor并整合其数据,标志着xAI在AI编程领域加速布局。
12. 0.9B跑出90%真机成功率!上海交大为VLA补上空间感
上海交大MINT团队提出Evo-Depth模型,通过隐式深度编码提升VLA的空间感知能力,无需额外硬件。该模型参数约0.9B,仿真与真机成功率分别达84.4%-95.4%和90%,部署显存约3.2GB,推理频率12.3Hz。模型采用轻量结构,融合隐式深度信息至视觉-语言通路,兼顾性能与部署效率,为VLA在空间任务中的应用提供了性能-成本-实时性的平衡方案。
国产AI公司面壁智能首次实现“AI造AI”,推出全球首个由AI自主编写的生产级预训练框架ForgeTrain,性能超越英伟达Megatron。基于此框架训练出的小模型MiniCPM5-1B,在参数量仅为1B的情况下,表现优于多款2B参数模型,展现高智能密度。该模型支持自定义人格,部署灵活,且提供完整工具链,助力端侧应用。此举标志着AI研发进入新阶段,推动大模型效率提升与国产生态发展。
14. 龙虾之父教你省钱:开源Skill给你的Skill减肥
文章介绍“龙虾之父”Peter推出开源工具skill-cleaner,用于优化Skill描述,提升Agent运行效率。核心观点是Skill描述应简洁,避免冗长,以降低token成本和运行延迟。工具提供五项功能:预算审计、重复检测、未使用筛查、根目录审计和描述精简。通过分析技能使用情况,帮助用户清理冗余、优化资源分配,提升整体效率。
15. 画数独、烧蜡烛都不翻车了?浙大&阿里让AI先三思再下笔|ACL 2026
浙江大学与阿里巴巴团队提出Unified Thinker模型,通过将推理与执行解耦,解决多模态生成模型在逻辑推理任务中的执行鸿沟问题。该模型引入独立的Thinker模块,负责生成结构化、可执行的中间表示,而Generator专注于像素合成,提升生成准确性与逻辑遵循能力。研究构建了包含结构化推理轨迹的数据集,并采用双阶段强化学习优化推理与生成过程,已在多个基准测试中表现优异,具备跨模型迁移能力,推动视觉生成从概率拟合向逻辑导向演进。
16. 量子位编辑作者招聘
量子位招聘编辑、主笔、主编等岗位,涵盖AI产业、财经和产品三大方向,要求具备相关领域知识与写作能力。岗位为全职,工作地点在北京中关村,提供行业资源、专业指导及丰厚薪酬福利。应聘者需提交简历及代表作品,通过邮箱申请。量子位作为AI领域头部媒体,拥有庞大用户基础和行业影响力。
17. 留给人类数学家的悬赏不多了!谷歌DeepMind一口气解决9道埃尔德什问题
谷歌DeepMind推出AlphaProof Nexus,利用Gemini驱动的智能体框架解决9个长期悬而未决的埃尔德什数学问题,包括56年未解难题,同时验证44个猜想和攻克代数几何难题。该系统通过大模型生成证明步骤并结合Lean编译器反馈循环验证,单题成本约几百美元,证明过程涵盖数论、组合几何等领域,展示了AI在数学证明中的强大潜力。
18. 卡帕西Anthropic最新头衔:技术员工(MTS)
Anthropic和OpenAI等AI公司采用“技术员工(MTS)”头衔,旨在扁平化组织、促进技术协作与跨领域创新。该制度有助于防止猎头挖人、增强文化认同及打破部门壁垒,但引发争议,部分人认为其掩盖了实际层级差异。尽管理念先进,但对早期职业者而言,头衔仍是重要职业筹码,引发对制度公平性的讨论。
19. 把VLM塞进隐式世界模型,小鹏机器人新框架让机器人长出物理直觉
小鹏机器人与高校团队提出DIAL框架,通过在VLM原生特征空间中进行隐式世界建模,实现语义推理与物理预测的统一,无需额外生成像素视频。该框架解耦意图与动作,利用两阶段训练提升稳定性和数据效率,在仿真与真实机器人任务中表现优异,展现强泛化与鲁棒性,为具身智能发展提供新思路。
此内容由 AI 自动生成 · 点击标题可查看完整文章
欢迎留言推荐您想要收录的公众号
夜雨聆风