
换了一个更强的M3模型。
刚切换那两天确实兴奋。能力更强了,响应更快了,输出的东西看起来也更漂亮了。每次对话都像在提醒你:这家伙比你之前那个厉害多了。
然后就没有然后了。
第三天,我默默切回去了。
不是它不好。真的不是。是我用着不舒服——那种不舒服很难形容,就像住进一套面积更大的房子,却发现自己在里面总是绷着神经,不知道什么时候会踩到地上的地灯。
问题出在哪?
我用M2.7的时候,脑子里始终有一个清晰的手柄:我想的是"让它帮我做什么"。它等我指令,我给方向,它执行。主动权在我手里。
换成新模型之后,这个手柄开始打滑。它会主动加东西进来,会自己立规则,会在某些节点上自作主张——不是说它做错了,而是它开始"想"了。它想的是"它要帮我做什么"。
一个是可控的工具,一个是不知道会产出什么的工具。
区别听起来很小,感受起来很大。用工具的时候,你心里是有底的;用那个不知道是什么的东西的时候,你永远在猜它下一步会做什么。这不是能力的问题,这是信任的问题。
后来我想明白了一件事。
愿不愿意用,才是评价AI助手的金标准。
能力强的工具未必愿意每天打开。就像一个能力很强的同事,如果每次合作都要你花大量时间解释背景、对齐预期、解释边界,你们的合作成本已经高过了合作收益。
在个人助手这件事上,稳定比惊艳更稀缺。
惊艳是一次性的体验,第二天就没了。稳定是每天都能用,用了都差不多,差不多了就能信任,信任了才会依赖。
写这篇文章的时候,AI助手还提醒我。会不会引起法律风险。
我的回答:
「我就是个个人消费者,我花钱了,对你的产品进行评价——这是我的权利和义务。」
这句话听起来像抬杠,但我想说的是:选择本身就是一种能力。知道自己需要什么,比知道什么更好,更重要。
选M2.7不是保守,是知道自己要什么。
个人助手的第一性原则,不是最强,是最愿意用。
真正可怕的,不是工具不可靠——是你不知道它什么时候会不可靠。
夜雨聆风