很多人还在讨论"AI会不会取代我"的时候,AI行业本身已经悄悄发生了一次根本性的变化。这个变化不是某家公司发了个新模型那么简单,而是整个行业的底层逻辑在变。
2025年5月发生的几件事,恰好可以拼出这张变化的全景图。
一、从"更大的模型"到"更聪明的系统":AlphaEvolve的意义
谷歌DeepMind在5月中旬发布了AlphaEvolve。很多人看到新闻标题——"帮谷歌节省0.7%的计算资源"、"Gemini训练速度提升23%"——可能觉得这就是一个优化工具,没什么大不了的。
但如果你仔细看它的架构设计,会发现这东西的意义远不止于此。
AlphaEvolve不是一个模型,而是一个**系统**。它的核心设计是这样的:
• 双模型协作:Gemini Flash负责快速生成大量候选方案(广度),Gemini Pro负责深度分析和精炼(深度)。两个模型不是简单的分工,而是形成了一个"生成-筛选-优化"的循环。
• 自动评估器:每一次代码修改都必须通过用户定义的评估函数打分。先跑快速的单元测试淘汰明显错误的方案,再跑更重的基准测试,全部自动化,不需要人工干预。
• 版本化记忆:系统会记住每一次尝试的成功和失败,下一轮迭代会基于历史经验来改进,而不是从零开始。
• 全仓库编辑:不像以前的AI工具只能改一个函数,AlphaEvolve可以同时修改整个代码库的多个文件,输出标准的diff格式。
这套设计的厉害之处在于:它把AI从"一次性生成答案"变成了"持续迭代优化"。以前你问AI一个问题,它给你一个答案,好不好就是那一个。现在AlphaEvolve可以不断地试、不断地改,直到找到最优解。
它已经打破了矩阵乘法领域56年的记录——这个领域的优化已经被人类数学家研究了半个多世纪。
**对行业的启示**:未来的AI竞争,不是比谁的模型参数多,而是比谁能把模型组合成更高效的系统。单个模型的能力有天花板,但系统设计的天花板要高得多。
二、DeepSeek的反共识路线:硬件感知的模型设计
当大家都在卷模型规模的时候,DeepSeek走了一条完全不同的路:**从硬件出发倒推模型设计**。
他们最新发布的研究论文详细阐述了DeepSeek-V3的设计哲学。这个模型有671B参数,但每个token只激活37B——通过MoE(混合专家)架构实现了"大模型的能力,小模型的成本"。
但真正有意思的是他们对硬件的极致利用:
• Multi-head Latent Attention(MLA):一种新的注意力机制设计,大幅降低了推理时的显存占用。这不是在软件层面的优化,而是深度理解了GPU的内存层级之后做出的架构级决策。
• 无辅助损失的负载均衡:MoE模型的老大难问题是"专家负载不均衡"——有些专家被频繁调用,有些闲置。传统方法是加辅助损失函数来惩罚不均衡,但这会损害模型性能。DeepSeek直接设计了一种不需要辅助损失的均衡策略。
• 多token预测:训练时不仅预测下一个token,还同时预测后面几个token。这让模型的推理速度翻倍,因为一次前向传播可以输出多个token。
• FP8低精度训练:在H800 GPU上直接用FP8精度训练,精度损失控制得非常好。这意味着同样的硬件可以训练更大的模型,或者训练速度翻倍。
整套训练只用了2.788M H800 GPU小时,训练过程"从未出现不可恢复的loss spike,也从未需要回滚"。这个稳定性在大模型训练领域是非常罕见的。
**DeepSeek的启示**:与其无限堆算力,不如把每一FLOP都用到极致。在算力越来越稀缺、越来越昂贵的今天,这种"硬件感知"的模型设计思路可能比单纯追求规模更有价值。
三、微软裁员的深层逻辑:不是"AI取代程序员",而是"会用AI的人取代不会用的人"
微软5月的裁员确实涉及数千人,但把它简单解读为"AI要取代程序员"是不准确的。
仔细看裁员的结构:受影响的主要是传统软件开发和IT运维岗位,而微软同时在大幅增加AI相关岗位的招聘。这不是"用AI替代人",而是"把资源从传统方向转移到AI方向"。
更值得注意的是微软内部正在发生的变化:
• GitHub Copilot已经深度集成到开发流程中,不只是补全代码,还能理解整个项目的上下文、提PR、写测试。
• 微软的开发者工具链(VS Code、Azure DevOps、GitHub)正在全面AI化,开发者的日常工作模式在变。
• 内部数据显示,使用Copilot的团队代码产出提升了30-50%,但代码审查的工作量反而增加了——因为AI生成的代码需要更多审查。
所以真正的趋势是:**AI不是取代程序员,而是在重新定义"程序员"这个职业**。只会写CRUD的人确实在被淘汰,但能理解业务、能设计系统、能审查AI代码的人反而更值钱了。
这对个人的启示很明确:与其担心被AI取代,不如主动学习如何与AI协作。工具变了,但解决问题的能力永远稀缺。
四、欧盟AI法案:全球AI治理的"第一块砖"
5月1日起正式实施的欧盟《人工智能法案》,表面上是欧洲的事,实际上影响是全球性的。
法案的核心设计是**分级监管**:
• 不可接受的风险:社会信用评分系统、实时远程生物识别(执法场景)→ 直接禁止
• 高风险:AI用于招聘、信贷评分、医疗诊断、自动驾驶 → 严格的合规要求,包括数据治理、透明度、人类监督
• 有限风险:聊天机器人、深度伪造 → 必须标注"AI生成"
• 最小风险:垃圾邮件过滤、游戏AI → 基本无限制
对出海企业最直接的影响是:任何在欧洲市场提供AI服务的公司,都必须遵守这套规则。违规最高罚全球营收的6%——对于年收入100亿美元的公司来说,就是6亿美元。
中国企业的应对策略也在分化:
• 大厂(阿里、腾讯、字节)已经在调整全球产品线的合规架构
• 中小企业面临两难:合规成本高,但放弃欧洲市场又不甘心
• 一些公司开始把"欧盟合规"作为产品卖点——能过欧盟审查的AI产品,本身就是一种质量背书
**更深层的影响**:欧盟法案会成为全球AI监管的参考模板。就像GDPR催生了全球隐私保护浪潮一样,AI法案可能会催生全球性的AI治理标准。先合规的企业,未来在其他市场也会占先机。
五、Kimi×小红书:AI落地的新范式
Kimi和小红书的合作看起来只是一次普通的商业合作,但它代表了一个重要趋势:**AI公司从"卖API"转向"嵌入场景"**。
以前AI公司的商业模式很直接:训练模型 → 开放API → 按调用量收费。但这种模式的问题是,AI公司离终端用户太远,不知道用户真正需要什么。
Kimi嵌入小红书之后,能做的事情远不止"智能推荐":
• 理解用户的真实意图(不只是关键词匹配,而是语义理解)
• 生成个性化的购物建议(结合用户的浏览历史、消费能力、审美偏好)
• 辅助创作者生产内容(但不是替代,而是提效)
• 优化搜索和推荐算法(从"猜你喜欢"到"理解你需要")
小红书得到的也不只是"AI能力",而是一个能持续学习的智能系统——用户的反馈数据会不断优化Kimi的模型,形成正循环。
**这个趋势的启示**:AI的价值不在于技术本身,而在于与具体场景的深度结合。未来最有价值的AI公司,可能不是模型最强的公司,而是最懂用户的公司。
六、视频生成和3D生成:内容创作的基础设施在重构
腾讯的HunyuanCustom和阶跃星辰的Step1X-3D开源,分别代表了视频生成和3D生成领域的最新进展。
视频生成赛道今年异常拥挤:Sora、可灵、HunyuanCustom……各家在比拼的不只是"生成质量",更重要的是"可控性"——能不能精确控制画面的每一个细节。
3D生成的意义可能更大。阶跃星辰开源Step1X-3D,意味着中小开发者也能用AI生成3D资产了。以前做一个3D模型需要专业建模师花几天时间,现在几分钟就能生成。这对游戏开发、VR/AR、电商展示、建筑设计等行业的影响是颠覆性的。
但这两个领域都面临同一个挑战:**质量不稳定**。AI生成的视频和3D模型,质量波动很大,目前还很难直接用于生产环境。人类创作者的审美判断和细节把控,仍然是不可替代的。
写在最后:范式转移中的机会
把这六件事放在一起看,一个清晰的趋势浮现出来:
AI正在从"单点突破"走向"系统整合"。
以前的竞争焦点是:谁的模型更大、谁的基准测试分数更高。现在的竞争焦点是:谁能更好地把AI融入实际场景、谁的系统设计更高效、谁能用更少的资源做到更多的事。
这意味着:
• 对开发者来说,只懂调API已经不够了,需要理解系统设计和工程优化
• 对企业来说,AI不是买个模型就能用的,需要深度的场景理解和持续的迭代
• 对个人来说,与其焦虑被取代,不如主动拥抱变化——AI是工具,不是对手
这个行业还在加速。保持学习,保持思考,才是最好的策略。
夜雨聆风