【AI圈事】Qwen新leader首秀,gemini 3.5低于预期

5月20号前后，中美两大厂前后脚扔出新模型。

阿里在阿里云峰会把Qwen 3.7-Max拍桌上，Google I/O把Gemini 3.5 Flash捧上主舞台。按理说这俩该各自霸占头条，结果舆情完全不对等——Qwen这边是"卧槽真猛"，Gemini那边却是"就这？"

反差有点大，咱们分头说一说。

Qwen 3.7-Max：新官上任首秀

自林俊旸离职后，关键接棒人之一就是谷歌来的周浩（参考Qwen团队地震，一些流传的消息）。千问新班子备受关注。

qwen3.6虽然是离职事件发生后发布，却与林难以分割。从某种意义上来说，qwen3.7算是新班子的首秀。

战绩还是可以的。

Qwen 3.7-Max-Preview上线之后，Arena AI盲测里直接杀到国产第一。

各种实测都指向它比较能打。本脑自己测的感受是，数学能力有明显提升，前端编码可靠了不少。

值得一提的是"35小时自主进化"的案例。在一个完全没接触过的芯片平台上，Qwen 3.7-Max从零开始，没文档没示例，自己写内核、编译、测性能、迭代优化，干了35小时，1158次工具调用，432次内核评估，最后把推理速度干上去10倍。

这是真的能干活了。

新班子的痕迹：思考过程"吞"了，一股谷歌味儿

有一个细节大家容易忽略：思考方式。

以前Qwen思考，会把完整的思维链摊开来给你看，模型怎么纠结、怎么自查，全透明。这次3.7-Max-Preview变了，只给你看一个"思维链总结"，真实推理过程藏起来了。

而且长的跟Gemini非常像。

今年3月，Qwen原后训练负责人郁博文离职，接手的叫周浩，前DeepMind高级资深研究员，直接参与过Gemini系列的工作。

这事逻辑线条非常明确。如果能追上谷歌，这波人士震动阿里的决策能算的上成功？拭目以待吧。

Gemini 3.5 Flash：谷歌的"快"，成了最大的遮羞布

说到谷歌，最近模型届无大事，谷歌这个3.5版本就颇受瞩目。

Gemini 3.5 Flash在I/O大会上占尽了C位，主舞台、默认模型、核心产品全接入。谷歌给的叙事很完美：速度是竞品的4倍，Agent能力碾压自家上一代旗舰3.1 Pro，价格还便宜。

但发布会一结束，社区情绪直接分叉。

Reddit和Linux.do上，早期用户分成两派。一派承认"快得离谱"，另一派直接开喷："快是快，但不够聪明。"有人算了一笔账："3.5 Flash唯一的强处就是快，也就是能够更快地消耗token，完成同样任务反而比3.1 Pro还贵，真绝了。"

更扎心的是实测。Linux.do社区对比发现，复杂人文讨论里，3.5 Flash即便开最高思考模式，深度和细腻度明显不如上一代3.1 Pro，被评价为"过于机械和生硬"。

Benchmark也藏不住尴尬。在HLE（极高难度学术推理）测试里，3.5 Flash只拿了40.2%，不仅全场垫底，还比自家上一代3.0 Flash的43.5%更低——代际更新反而退步，这在AI圈相当罕见。

想当初Gemini 3.1 Pro出来那会儿，网上一片"谷歌终于睡醒了"的欢呼。这次3.5 ，甚至有人直呼美版豆包，言外之意几乎溢出屏幕。

一句话总结

模型马拉松的后半场，大厂着实吃力了。可能是带着包袱赛跑的缘故。

不过作为持票者，本脑说句公道话，还是很看好两位的，加油。

关注我（公众号『正电子脑』），获取更多ai洞察。