乐于分享
好东西不私藏

4月27日 AI 焦点

4月27日 AI 焦点

GPT-5.5 发布、Claude 团队免费教程、Kimi K2.6 崛起。这是今年 AI 发展节奏的一个缩影:模型迭代没有放缓,实用工具和开源生态在加速。

模型战局

OpenAI 发布 GPT-5.5 和 GPT-5.5 Pro,在 FrontierMath Tier 4 上拿到 39.6% 的成绩,BrowseComp 达到 90.1%,GDPval 84.9%,Terminal-Bench 2.0 82.7%。Sam Altman 说看到开发者说这些工具有用是最让他满足的事。

这次发布的一个特点是速度快、质量不妥协。实测显示,GPT-5.5 的思考时间比之前的 5.x 系列明显减少,但回答质量没有因此下降。

中国模型突围

Kimi K2.6 在 OpenRouter 上超越了 Claude Opus 4.7,成为排名第一的代码生成模型。价格只有 Claude Opus 4.7 的七分之一,能并行运行 100 个子代理,每个任务最多 1500 步。

换句话说什么?当国外模型在营销和生态上投入时,一些中国团队选择了另一种路径:把算力用在刀刃上。

Claude 团队的实用主义

Anthropic CEO Dario Amodei 说编程会先消失,然后是整个软件工程。他认为软件工程将在 12 个月内完全自动化。

这些话听起来激进,但 Anthropic 的团队在行动上很务实。他们发布了一个 24 分钟的免费教程,由亲自搭建 Claude 的工程师讲解提示词技巧。教程里有 40 个实用技巧,没有废话,没有付费墙。

另一个细节是 CLAUDE.md 文件的最佳实践指南。三层级架构:全局规则、项目共享上下文、个人本地覆盖。这种对配置文件的重视,说明他们在认真思考如何让 AI 在实际生产环境中稳定工作。

AI Agent 的现实

有人分享了一个现实案例:安装了 7 个 AI 工具,只留下了 2 个——Fathom 和 Zapier。其他都被丢弃了。

这位创业者说了一个值得反思的问题:很多 CEO 都在说”我们需要 AI”,但你问他们要做什么,他们不知道。

同样的,Peter Thiel 给出了一个完全相反的判断:AI 对数学工作者的伤害会比文字工作者更大。这与过去三年创业圈流行的”AI 先吃掉创意类工作”的叙事完全相反。

开源硬件与工具

Asimov 宣布开源 Asimov v1 人形机器人。1.2 米高、35 公斤、25 个自由度,机械结构用 7075 铝合金和 MJF PA12 尼龙 3D 打印。开放机械设计和仿真文件,提供开源自制清单。DIY 套件 499 美元定金,目标价 15000 美元,预计 2026 年夏末发货。

另一个工具是 Blueprint,可以理解为”电子版的 Claude Design”。输入你想要建造的东西,它会生成 Arduino 或树莓派项目需要的所有东西:接线图、物料清单、分步组装指南。

编程工作的矛盾

一个有趣的观察:自从开始使用 AI 以来,每个程序员每天工作 20 小时。理论上这项技术应该把我们从繁重的劳动中解放出来,但实际上发生了相反的事情。

这可能说明:AI 让编程的门槛降低了,但没有让复杂问题的难度消失。相反,更低门槛带来了更多需求,让擅长使用 AI 的人更忙碌。

4 月 27 日的 AI 动态里,能看到几个清晰的信号:模型竞赛进入深水区,中国团队在性价比上找到了突破口,Claude 团队在实用主义上保持清醒,开源硬件和工具生态在加速,而关于 AI 对就业影响的理论与现实之间,还存在巨大的鸿沟。