乐于分享
好东西不私藏

头部模型杀红眼,办公工具革了命,AI的“iPhone时刻”原地升级

头部模型杀红眼,办公工具革了命,AI的“iPhone时刻”原地升级

AI圈又炸了!OpenAI扔出双王炸,一脚踹开了新世界的大门。

先看王炸一号:GPT-5.5。这个新旗舰有多猛?编码、自主行动、网络安全,直接看齐Claude Mythos,智商更是飙到了145。在ARC-AGI-2测试中,它一举砍下85%的分数,把纪录撕了个粉碎。配套的超高速Codex不仅输出快到起飞,成功率还极高。

王炸二号则是图像模型GPT-Image-2,全量上线。它能听懂你的需求,自己规划构图,联网找参考,甚至还会自我检查防穿帮,真实度直接拉爆同行。

头部阵营这边,早已不是一家唱戏。Kimi开源了参数高达1.1万亿的Kimi K2.6,综合跑分紧咬前三。DeepSeek也亮出了1.6万亿参数的DeepSeek V4,性能与阿里的Qwen3.6Max正面硬刚。更有意思的是谷歌,创始人Sergey Brin亲自挂帅,死磕Gemini的编程能力——只因目前Gemini内部代码采用率才刚过50%,而对手GPT-5.5和Claude Mythos的代码替代率已经逼近100%,这差距让大佬坐不住了。

工具层面同样杀疯了。Office三件套直接全量上线Copilot智能体,还把它设为了默认模式。谷歌的Deep Research Max更是恐怖,全网搜索、处理私密数据、生成图表一气呵成,半天就能端出一份专业研报。他们还开源了一个设计规范智能体,能按品牌视觉规范直接输出UI。

再来看看AI的自主进化。研究员开源的AI研究员ASI-Evolve,已经能自己查论文、写代码、跑实验、自我迭代,直接发现了105个全新的神经网络架构。还有OpenGame,这个开源智能体可以凭空生成一部完整的网页游戏,从零到成品一气呵成。

多领域也在遍地开花。谷歌的Vision Banana模型,听你一句语音就能把图像中的目标部位精准分割出来。LTX开源了HDR LoRA,瞬间能把AI视频升级为HDR画质。ODYSSEY的Odyssey-2 Max世界模型,支持无限时直播和实时互动改剧情。字节跳动的Seed3D 2.0,能生成带关节、可直接交互的3D资产。最后还有个狠活,一位工程师打造的乒乓球机器人,在虚拟环境里疯狂自我对练后,登场就把奥运选手打了个落花流水。

属于AI的质变时刻,真的来了。