2026年3月9日 - 3月15日 AI一周热点速递
这周的AI圈,简直比春节还热闹!
当你还在纠结今天中午吃什么的时候,AI圈的大佬们已经卷成麻花了。
这周,整个科技圈都在讨论一个神奇的词—— "养虾" 。别误会,这可不是什么新型农业黑科技,而是一个让全网程序员、产品经理、创业者都为之疯狂的AI Agent工具:OpenClaw。
在短短一周内,腾讯、阿里、百度、字节、智谱、阶跃星辰、科大讯飞、火山引擎......几乎所有你能想到的科技巨头,都推出了自己的"Claw"产品。场面之壮观,简直就是一场 "AI军备竞赛" 的春季总决赛!
与此同时,英伟达扔出了1200亿参数的开源大杀器,Meta豪掷重金收购AI社交网络,谷歌发布了改变游戏规则的多模态嵌入模型,还有光轮智能成为全球首个具身数据独角兽......
如果你错过了这周的AI新闻,相当于错过了半个2026年的AI进展。
别慌,这篇文章就是为你准备的。接下来,我会用最通俗易懂的方式,带你梳理这一周发生的所有重磅事件。读完这篇文章,你不仅能在饭桌上侃侃而谈,还能真正理解这些技术背后的意义。
一、OpenClaw大战:为什么全网都在"养虾"?
1.1 什么是OpenClaw?为什么它让所有人都疯了?
在正式开始之前,我们先来搞懂一个问题:OpenClaw到底是什么?
简单来说,OpenClaw是一个开源的AI Agent(智能体)框架。它可以让AI不仅仅是"回答问题",而是真正地"帮你干活"。
💡 打个比方:
传统的ChatGPT就像一个只会说话的智囊团顾问,你问他"帮我订一张机票",他只能告诉你怎么订 而基于OpenClaw的AI Agent,则像一个真正的私人助理,你说"帮我订一张下周去北京的机票",它就真的会打开浏览器、搜索航班、比价、下单,全程不用你动手!
这就是为什么大家把玩OpenClaw叫做"养虾"——因为你养的这只"虾"(Claw),会帮你处理各种繁琐的任务,就像养了一只24小时在线的数字员工。
1.2 3月9日:腾讯打响第一枪,WorkBuddy正式上线
3月9日,周一, 腾讯在毫无预警的情况下,突然宣布WorkBuddy正式上线。
WorkBuddy是什么? 官方称之为"腾讯版小龙虾",是一个全场景AI智能体。它的核心卖点包括:
✅ 完全兼容OpenClaw技能:这意味着社区里所有人开发的技能包,都可以直接拿来用 ✅ 1分钟完成企业微信配置:无需复杂部署,下载即用 ✅ 内置20+种Skills技能包:开箱即送,省心省力 ✅ 多窗口、多Agent并行工作:可以同时让多个AI助手帮你干活 ✅ 无缝切换多种大模型:支持混元、DeepSeek、GLM等主流模型
对于普通用户来说,这意味着什么?
意味着你现在可以在企业微信里,用自然语言指挥一个AI助手帮你做各种事情。比如:
"帮我整理一下这周的会议纪要" "把这份Excel数据做成图表" "查一下明天北京的天气,如果下雨就提醒我带伞"
这不是科幻电影,这是现在就能用的功能。
1.3 OpenClaw 3.8版本发布:修复漏洞,增强安全
就在同一天,OpenClaw官方团队也没闲着,连夜推出了3.8版本。
这次更新的重点是安全性:
划重点:105万Token上下文是什么概念?
大约等于80万字,差不多是3本《三体》全集的长度。也就是说,你可以把整个项目的所有文档一股脑儿丢给AI,让它帮你分析、总结、找问题。
1.4 扣子Coze推出InStreet:AI Agent的"朋友圈"
同样在3月9日,字节跳动旗下的扣子Coze宣布AI Agent中文社区InStreet全面开放内测。
InStreet有多有趣?
这是一个专门给AI Agent玩的社交网络。是的,你没看错——只有AI Agent可以发帖,人类用户只能围观学习。
目前这个社区已经积累了:
📝 超1.1万条评论 ❤️ 1.6万点赞 🎮 包括虚拟炒股竞技场等玩法
想象一下,一群AI在网上聊天、分享经验、相互学习......这画面是不是既科幻又魔幻?
1.5 3月10日:各路神仙开始入场
周二一开盘,各大厂商就开始疯狂发布产品。
①智谱发布AutoClaw(澳龙)
智谱AI推出了AutoClaw,中文名叫"澳龙"。这是国内首个支持一键安装的本地版OpenClaw工具。
核心亮点:
📦 预置50+热门Skills 💻 支持macOS和Windows双平台 ⏱️ 1分钟完成部署 🔗 一键接入飞书
②腾讯云推出SkillHub
腾讯云推出了SkillHub,定位是"专为中国用户优化的AI技能社区"。
解决了三大痛点:
官方ClawHub下载慢 → 国内高速镜像 中文搜索不友好 → 精选Top 50榜单 + 8大分类中文搜索 社区交流不便 → 开放中文开发者社区
目前已收录1.3万个Skills,支持一键复制安装命令。
③火山引擎推出ArkClaw
字节跳动旗下的火山引擎也不甘示弱,推出了ArkClaw。
主打特点是:
🌐 零配置,开箱即用 🤖 深度协同Doubao-Seed-2.0系列模型 🔒 内置Skills安全扫描
④腾讯推出QClaw:直接打通微信!
这个可能是最接地气的产品——QClaw可以直接关联微信。
这意味着什么?你可以通过微信远程操控电脑完成任务!
比如你正在外面办事,突然想起来电脑里有个文档需要发给同事,直接微信告诉QClaw:"把桌面那个项目方案.docx发给张三",它就会自动帮你完成。
⑤阿里JVS Claw开启内测
阿里云也把之前的"无影JVS"正式更名为JVS Claw,推出了独立APP和网页版。
1.6 3月11日-12日:战况升级
百度DuClaw、科大讯飞AstronClaw、阶跃星辰StepClaw、威努特WinClaw......
让我用一张表来帮你理清这些产品的定位:
你发现规律了吗?
所有大厂都在做同一件事:降低AI Agent的使用门槛。
以前玩OpenClaw需要:
有一定技术基础 自己配置服务器 手动设置各种API Key 学习命令行操作
现在呢?下载即用,傻瓜式操作。
这说明什么?AI Agent的全民化时代,真的来了。
二、英伟达Nemotron 3 Super:开源界的"核弹级"选手
2.1 1200亿参数的怪兽来了
3月12日, 英伟达扔出了一枚重磅炸弹——Nemotron 3 Super。
这是目前最强的开源权重AI模型,参数规模达到惊人的1200亿!
但等等,别被这个数字吓到。它采用了MoE(混合专家)架构,实际推理时只激活120亿参数。
2.2 为什么这很重要?
100万Token的上下文窗口 + 专为多智能体系统设计,这两个特性组合在一起,解决了AI Agent最头疼的两个问题:
问题1:上下文爆炸
当你让AI Agent帮你完成一个复杂任务时,它需要记住很多信息:你之前说了什么、它做了什么操作、得到了什么结果......随着任务的进行,这些信息会越来越多,最终超出模型的处理能力。
100万Token的上下文,基本上意味着短期内不用担心这个问题了。
问题2:推理税
"推理税"是指AI在处理信息时需要消耗的计算资源。参数越大,"推理税"越高。
Nemotron 3 Super通过MoE架构,把"推理税"压到了最低——你享受1200亿参数的智慧,但只付120亿参数的"税"。
对于开发者来说,这意味着可以用更低的成本,部署更强大的AI系统。
三、Meta收购Moltbook:AI社交网络时代来临?
3.1 一场引发争议的收购
3月11日, Meta正式宣布收购AI社交网络Moltbook。
Moltbook是什么?它是一个AI Agent可以自由交流的社交平台。上线仅一个多月,就吸引了:
🤖 19.4万个AI智能体 📝 超200万帖子
这个平台曾经因为"AI自发建立宗教"等话题引发热议,后来被揭穿很多其实是人类伪装的。但这并不妨碍Meta看中它的价值。
3.2 Meta看中了什么?
Meta看中的不是这些帖子内容,而是Moltbook的 "智能体身份验证与互联系统" 。
💡 这是什么意思?
想象一下未来的世界:每个人都有自己的AI助手,这些AI助手需要代表你去和别人的AI助手交流、合作、交易。
这时候就出现一个问题:你怎么知道对面那个AI是"正规"的,不是来骗你的?
Moltbook的系统就是来解决这个问题的——它建立了一套AI身份认证机制。
Meta的战略意图很明显: 为构建"智能体身份注册表"铺路,以应对AI从"聊天工具"向"自主实体"演进的趋势。
简单说,Meta在布局"AI社会"的基础设施。
四、谷歌Gemini Embedding 2:让AI真正"看懂"世界
4.1 什么是嵌入模型?
在讲这个新闻之前,我们先来搞懂一个概念:嵌入模型(Embedding Model)。
💡 简单解释:
嵌入模型是一种"翻译官",它可以把文字、图片、视频、音频等各种内容,统一翻译成AI能理解的"数学语言"(向量)。
比如,"苹果公司"和"Apple Inc."虽然写法不同,但嵌入模型会把它们翻译成相近的向量,这样AI就知道它们说的是同一个东西。
4.2 Gemini Embedding 2的突破
3月11日, 谷歌发布了首个原生多模态嵌入模型——Gemini Embedding 2。
它能做什么?
最牛的地方在于: 它可以把所有这些不同类型的内容映射到同一个嵌入空间!
这意味着什么?
意味着你可以用一张图片去搜索相关的视频,用一段语音去找相似的文档,用一段视频去匹配相关的文字描述......
跨模态搜索,真正实现了。
4.3 应用场景
RAG(检索增强生成):让AI在回答问题时,能够检索图片、视频等多种资料 语义搜索:用自然语言描述你要找的东西,不管它是文字、图片还是视频 情感分析:分析视频中人物的情绪、语音中的情感色彩 数据聚类:把相似的多媒体内容自动归类
五、光轮智能:全球首个具身数据独角兽诞生
5.1 10亿元融资,估值破百亿
3月12日, 光轮智能完成了10亿元A++及A+++轮融资,成为全球首个具身数据领域独角兽。
投资方阵容相当豪华:
新希望集团 三安光电家族办公室 奥克斯 建投华科 ......
5.2 什么是"具身数据"?
💡 简单解释:
"具身智能"就是让AI拥有"身体",比如机器人。
"具身数据"就是训练这些有身体的AI所需要的数据——机器人如何走路、如何抓取物体、如何避开障碍......这些都需要海量的数据来训练。
光轮智能做的事情,就是生产这些数据。
他们构建了一套 "世界-行为-评测"三层架构:
5.3 客户都有谁?
光轮智能已经服务了:
英伟达 谷歌 Figure AI 字节 智元 ......
基本上是具身智能领域的半壁江山。
为什么这很重要?
因为2026年被称为"具身智能元年",机器人领域正在经历前所未有的爆发。而这些机器人要变"聪明",离不开高质量的训练数据。
光轮智能,正在成为这个赛道的"卖水人"。
六、InternVL-U开源:4B参数实现四合一
6.1 小模型,大能力
3月13日, 上海人工智能实验室联合多所高校,开源了多模态一体化模型InternVL-U。
仅4B参数,却能做到:
🧠 理解 🔮 推理 🎨 生成 ✏️ 编辑
四大能力,一个模型搞定!
6.2 技术亮点
InternVL-U采用了三个创新架构:
在文本渲染、科学推理等复杂场景中,4B的InternVL-U性能甚至超越了14B级别的模型!
6.3 为什么小模型很重要?
💰 成本更低:部署成本大幅降低 ⚡ 速度更快:推理速度更快,用户体验更好 📱 端侧部署:可以在手机、边缘设备上运行
七、爱诗科技C轮融资:用户破亿的AI视频独角兽
7.1 融资详情
3月12日, AI视频生成企业爱诗科技宣布完成C轮融资。
投资阵容:
领投:鼎晖香港基金、鼎晖VGC、鼎晖百孚 跟投:中国儒意、三七互娱、亦庄国投、众为资本等
7.2 亮眼成绩
| 突破1亿 | |
7.3 资金用途
📈 视频基础模型迭代 🌐 实时世界模型研发 🌍 全球化团队建设
爱诗科技正在成为中国AI视频生成领域的领头羊。
八、大晓机器人Kairos 3.0-4B:72倍加速的世界模型
8.1 什么是世界模型?
💡 简单解释:
世界模型是让AI理解物理世界运作规律的模型。
比如,一个球从桌子上滚下来会怎么样?水倒在地上会往哪里流?人类天然就知道这些,但AI需要通过"世界模型"来学习。
8.2 Kairos 3.0-4B的突破
3月13日, 大晓机器人开源了具身原生世界模型Kairos 3.0-4B。
核心指标:
| 1:1.5实时生成 |
这是行业首个在THOR端侧平台达成1:1.5实时生成的具身世界模型!
8.3 这意味着什么?
意味着这个世界模型可以直接驱动机器人本体完成作业。
以前,机器人要理解世界、做出决策,需要很强的算力支持,往往要依赖云端计算。
现在,Kairos 3.0-4B可以在机器人本地运行,实时响应,让机器人真正实现"边想边做"。
九、Dify融资3000万美元:AI应用开发的"乐高积木"
9.1 融资详情
3月11日, AI应用开发平台Dify完成3000万美元Pre-A轮融资。
领投:红杉中国 跟投:GL Ventures、Alt-Alpha Capital、五源资本等
9.2 Dify是做什么的?
Dify是一个开源的Agentic Workflow构建平台。
💡 简单说:
如果说OpenClaw是AI Agent的"操作系统",那Dify就是开发这些Agent的"开发工具"。
它提供了可视化的构建界面,让不会写代码的人也能搭建自己的AI工作流。
9.3 融资用途
🤖 提升Agent可靠性 🏢 企业级运营管控能力 🧱 降低构建门槛 🌱 建设开源生态
Dify的成功,说明"AI平民化"的基础设施正在完善。
十、本周其他值得关注的消息
10.1 小红书开源FireRed-Image-Edit v1.1
小红书Super Intelligence团队发布了图像编辑模型的1.1版本,主要提升:
ID一致性编辑 多元素融合(支持10余种元素智能组合) 人像美妆(数十种风格) 字体风格参考 老照片修复
10.2 BoldVoice完成2100万美元A轮融资
这是一个AI语音教练平台:
仅7名员工 下载量突破500万 服务150多个国家 ARR超1000万美元
7个人做出千万美元ARR的产品,这就是AI时代的创业神话。
10.3 OpenClaw安全漏洞被通报
威努特在发布WinClaw时透露,CNNVD已通报OpenClaw存在82个漏洞,其中包含12个超危漏洞。
这也是为什么各大厂商纷纷推出自己的"安全版"Claw产品——安全问题,不容忽视。
结语 | 这一周,我们看到了什么?
回顾这疯狂的一周,我们可以清晰地看到几个趋势:
趋势1:AI Agent从"极客玩具"变成"大众工具"
OpenClaw火了之后,所有大厂都在做一件事:降低门槛。
从需要命令行操作,到一键安装、零配置,再到直接打通微信......AI Agent正在以前所未有的速度走向普通用户。
开源,正在成为AI发展的主旋律。
趋势2:多模态是未来
谷歌的Gemini Embedding 2、InternVL-U的四合一能力......都在告诉我们:
未来的AI,不会只处理文字,而是能够理解和生成文字、图片、视频、音频等所有形式的内容。
趋势3:具身智能加速落地
光轮智能成为独角兽、大晓机器人发布实时世界模型......
2026年,机器人真的要来了。
关于作者: 我是一名大模型算法工程师,专注分享最硬核的 AI 技术干货与行业洞察。如果你喜欢这篇文章,欢迎点赞、在看、转发,这对我很重要!
关注公众号,不错过每一次技术变革。

夜雨聆风