AI 开始抢具体岗位了
昨天这批消息里,热闹当然很多,但真正有后劲的不是谁又发了一个新名字,而是谁已经开始往具体岗位里塞能力。看下来最清楚的一条线是,厂商不太满足于继续卖通用能力了,它们要抢的是酒店前台背后的流程、实验室里的研究环节、开发者手里的工程栈,还有内容团队会不会真把语音接进生产。
OpenAI 联手凯悦,把 ChatGPT Enterprise 推进酒店一线
凯悦这条最值得多看两眼。酒店不是那种随便挂个聊天框就能交差的行业,岗位碎,协同重,前台、运营、客服、总部系统全拧在一起。OpenAI 这次不是讲一个内部提效故事,而是把 ChatGPT Enterprise 往全球团队和酒店一线推。
同一天它又在补 Agents SDK,GitHub 上 openai-agents-python 还在继续涨,这几条放一起看,平台方现在要卖的不是一句“大家都能用 AI”,而是“我能不能进你的日常流程”。谁先进这种重服务场景,谁就更容易把企业 AI 从演示页拉进预算表。
OpenAI 发布 GPT-Rosalind,押注生命科学研究
GPT-Rosalind 也不是常规的新模型发布。它直接点名药物发现、基因组分析、蛋白质推理,摆明了不是继续做一个“什么都能聊一点”的通用产品,而是往生命科学这种高价值、高门槛行业里钻。
这和凯悦那条放一起看,其实是同一件事的两面。一边往线下运营场景走,一边往专业研究场景走,中间差别很大,但共同点只有一个,厂商开始挑更贵、更深、更不容易被替代的工位下手。
OpenAI 升级 Agents SDK,补上沙箱和长任务能力
Agents SDK 这次补的是沙箱执行、长任务、多工具协作,这些东西一点都不性感,但真做过 Agent 落地的人都知道,卡项目的往往就卡在这里。另一边,官方 Python 框架还挂在 GitHub 热榜上,说明开发者不是把 Agent 当话题玩了,而是在认真挑底座。
还有个细节也挺说明问题,Hugging Face 那边连续在修 tokenizer、训练链路和 Gemma 兼容性。热搜归热搜,工程栈的修补节奏才是真正决定“能不能上”的东西。
Gemini 3.1 Flash TTS,主打更细粒度语音控制
Google 推 Gemini 3.1 Flash TTS,重点不是声音更像人,而是开发者终于能更细地控制语气、节奏和风格。Simon Willison 也专门拎出来写,说明这不只是一次常规模型上新。
语音这条线接下来比的,大概不是谁更会说漂亮话,而是谁更像工具。客服、短视频配音、数字人、播客切片,这些场景不缺“能发声”的模型,缺的是能改、能复现、能接流程的模型。
Claude Token Counter 新增模型对比
Simon Willison 这一串更新很像另一种风向标。他一边给 Claude Token Counter 加模型横比,一边跟进 llm-anthropic 0.25 和 Opus 4.7 的思考参数,转头又在本地测 Qwen3.6-35B-A3B。这里最有意思的不是哪家口号更响,而是开发者已经不太吃口号了。
大家开始问的是,分词器变了多少,token 成本怎么算,thinking_effort 值不值,本地模型到底能不能顶掉一部分云端调用。这类问题不一定最适合做标题,但最接近真实采用,因为团队最后拍板,看的就是成本、稳定性和迁移难度。
所以昨天真正往前走的,不是模型榜单,而是 AI 往具体岗位里又拱了一步。后面更值得盯的,就是谁能先把这种“拱进去”做成可复制的默认配置。
夜雨聆风