上海,4月18日。
昨天开始的人形机器人生态大会还在继续,展馆里一台机器人正在打拳击,隔壁摊位的机器人在炒菜,再走几步,另一台在表演街舞。
我看到这几张图的时候有点懵。
不是因为酷,而是因为这不是前几年PPT上画的未来,这是今年上海真实发生的事。
与此同时,DeepSeek V4发布进入最后倒计时,阿里开源了一个30亿激活参数但能打赢270亿稠密模型的新家伙……
说是平平无奇的周五,结果一条一条看下来,每条都挺炸。
机器人终于不只是"看看"了
先说机器人这条线,因为这是目前最让我觉得"真实"的进展。
宇树科技带来了G1 EDU U2进阶版。这台机器人现场打拳击、跳街舞,流畅度已经不像早年的卡顿示范,更像是这个东西真的能用了。
宇树还带来了Go2消费级四足机器人,核心点是"关节灵活度可按需开发定制"。这句话的意思是他们在开放平台,不只是卖硬件了。
更落地的是星动纪元。他们和北自科技合作,把机器人放进了物流分拣。机器人识别药盒,抓取大小不同的物体,目前已在北京、深圳、广州的集散中心跑起来了。顺丰、邮政都签了合作。
不是演示,是真的在干活。
70%改性PEEK减速器减重比例(宁波华翔)
5.3kg单台人形机器人整机减重,峰值扭矩损失<10%
3城星动纪元+北自科技:北京、深圳、广州集散中心已部署
5.3公斤什么概念?一台机器人总重大概40-50公斤,减5公斤意味着续航、灵活性、运输成本全改善了。
这些公司在解决的,不是科幻里的问题,是量产路上的工程问题。
哈工大机器人研究所所长赵杰:"人形机器人是全球科技竞争的必争高地,需要超前二十年的视野布局颠覆性创新。"
超前二十年。但量产,今年已经在发生了。
DeepSeek V4:行业把参数量估算少了60%
大模型这边,DeepSeek V4今天再次曝出技术细节,发布倒计时越来越近。
此前大家预测V4的参数量,结果估算错了。
根据今天DeepGEMM算子库更新泄露出的信息,V4引入了Mega MoE架构,专家数量从V3的固定256个,扩展到动态数千个,总参数量估计在1.6T(1.6万亿)左右。
1.6TDeepSeek V4总参数量(比行业预期高约60%)
数千Mega MoE专家数(V3仅固定256个)
-70%硬件资源占用降低,通信资源同降60%
更有意思的是效率这块:Mega MoE架构减少了约70%的硬件资源占用,通信资源消耗降低60%。意思是模型更大,但部署成本反而下来了。
这是DeepSeek一贯的思路,不只比大,还比省。
V4的另一个亮点是全面押注华为昇腾芯片。梁文锋的内部说法是"放弃英伟达,死磕华为"。如果V4能在昇腾上跑出好成绩,国产算力的可信度会迎来一次重要背书。
这个赌注,4月下旬见分晓。
阿里开源了一个用30亿打赢270亿的模型
这条消息单独看显得低调,但放在今天的语境里很说明问题。
4月16日,阿里开源了Qwen3.6-35B-A3B。数字解释一下:350亿总参数,但激活参数只有30亿。MoE架构的典型特征,大部分专家在推理时"睡觉",只有被激活的那部分在干活。
结果是用30亿参数的计算量,打赢了270亿参数的稠密模型,智能体编程能力跟Qwen3.5-27B、Gemma4-31B这些大得多的模型在同一档次。
实用价值很直接:你可以在一张消费级显卡上跑这个模型,但它给出的答案不比那些需要多卡运行的大模型差多少。
1.4万亿Qwen3.6-Plus上线24小时API调用量(Token),登顶OpenRouter全球日榜
6亿国内生成式AI用户规模,每2个网民就有1个在用AI
500万美元Shopify切换阿里千问每年节省成本(据测算)
一个月前,国内生成式AI用户刚突破6亿。这个普及速度,比个人电脑和互联网当年都快。
这些东西什么时候会直接影响到你?
今天三条新闻放在一起,与其问"AI和机器人往哪走",不如问一个更具体的:这些东西什么时候会直接影响到你?
机器人那边,今年是量产元年。不是所有公司都能活下来,但活下来的,会在3-5年内进入你能感知到的场景。物流分拣今年已经落地,炒菜机器人今年在上海展馆里干活了。
大模型那边,竞争主线从"谁更聪明"变成了"谁更便宜、谁更好部署"。DeepSeek往更大但更省这个方向走,阿里往小身材大能量这个方向走,但都在解决同一个问题:把AI放进更多地方。
Shopify已经把核心业务切换到阿里千问,据测算每年省500万美元。这不是个例,这是企业用AI替换成本的起点。
你现在用的那些APP,1-2年后里面跑的AI,已经不会再是那几家的专有API了。
工具的门槛在变低。会用的人,优势在变大。
今天让你做一件事:找一个你工作里重复频率最高的环节,花10分钟想想,有没有工具能替你做。
可能找不到,可能找到了但不好用,但想这件事本身,值得。
你现在最顺手的AI工具是哪个?聊聊。👇
夜雨聆风