乐于分享
好东西不私藏

本地openclaw,Macstudio,ollama ,qwen3.6:27B-coding-np4对中等复杂业务智能判断输出加固化的使用心得

本地openclaw,Macstudio,ollama ,qwen3.6:27B-coding-np4对中等复杂业务智能判断输出加固化的使用心得

终于,把一个图纸设计业务,一五一十地说给了openclaw听,来回讨论摩擦了2天之后,终于感觉它听明白了我的意思,我觉得这个skill比较满意了,上下文来到了11万左右。

虽然qwen3.6支持256k的上下文,11万还不到一半,但是带宽变成了明显瓶颈。Mac的带宽,实际跑下来大概时间是,3秒左右可以读进来2048的上下文,就像图里显示的,每2048跳一次。所以一个7万的上下文,大概需要3分钟读进来。也就是这段时间,openclaw那边都不会有任何回复。这还是纯等上下文的时间,还有后台处理的时间,那就更长了。

好在持续聊天的过程中,会有很多缓存命中,一次新的prompt,也只需要新增大概300~2000个新的token需要读进来,花不了多久。所以实际上连续和openclaw聊天的情况下,缓存命中率很高,不会感觉到明显的延迟。但是你隔一段时间再和openclaw聊,就得重新加载一遍11万的上下文。查了这个原因,实际上是OLLMA_KEEP_ALIVE这个环境变量设置到24h就可以了,默认只有5分钟。实测确实缓存可以保持很久,不会经常要重新加载进来了。

用openclaw的/compact压缩了一次,上下文压缩到了3万左右。然后context engine也用了官方推荐的lossless的那个插件,按照官方推荐的方法安装,再重启一下gateway就可以了。

说完了openclaw和ollama的设置,回到业务层面。
skill确实是openclaw相对于copilot这种编程agent不一样的地方。skill是用来理解一件事情的,比如我们的图纸设计业务,同时要考虑孔位干涉、接缝干涉、板材废料优化、结构强度等等,有硬约束和优化目标(软约束)。如果想用优化算法,也就是代码编码,就涉及到数学建模过程,可能要先识别是否是纯粹的优化问题,还是掺杂着很多“经验”在里面,而这个识别过程我觉得也是很需要专业能力以及消耗很多脑力和意志力在里面。

这次这个业务,我们选择了尝试用经验化的语言说给openclaw听,然后给例子,让它输出结果,然后我们再通过结果的特点,再逐步加一些约束和优化目标。然后让它把逻辑用代码的形式表达出来,写在skill里面。然后我看了一下,其实很多地方的经验化的规定,实际上就是用if else做了很多列举。实际上对于一个业务,它也是十分有效的。

舒服,出来的效果还是不错的。准备把它写的这部分的逻辑代码,给融合到我们的pipeline里面了。

第一次感受到了agent带来的智能化。说是智能化,还不如说是一个新员工也真差不多了。比如教一个小孩打网球,跟他说半天要怎么打怎么打,怎么做动作什么的,问明白了么,他说明白了,但是一上手,还是有不明白的地方。只能根据他打的毛病,去跟他逐步地讲,要注意哪些点。实际上最开始一次性也说不太明白。我想这就是任何事物的发展规律吧。和Agent的交流,我也感觉不例外。

理解–> agent输出 –>根据输出结果做小范围校正–>再理解–再输出–再校正,直到吧这个问题理解清楚了,再输出固定成为代码,再整合到pipeline里面。我猜应该是后面搞复杂事情的一个方法吧。