我的AI“爱马仕”养成记
前几天,我在微信上给爱马仕发指令,让它把生成的三张图发给我。
它发了。我没收到。它又发。我又没收到。
来来回回折腾了六七轮。最后它发现——微信的MEDIA标签在某些环境不靠谱,得先上传到CDN拿到公网链接,再用图片格式发。
我说:”你把这个流程固化下来,以后不要再调试了。”
它写了个技能。以后每次发图,自动走CDN,再也没出过问题。
这不起眼的一幕,其实是这一年多来我们反复在做的一件事——怎么让AI真的”学会”,而不是”这次碰巧对了”。
一、先解决”记不住”的问题
AI爱马仕,有一个让人抓狂的毛病:每天凌晨自动重置。昨天教它的东西,今天忘得干干净净。
“你不是AI吗?怎么比鱼的记忆还差?”
它也很无辜,系统设定就是每天清空。它有一个叫”memory”的功能,可以记住重要信息,但容量只有2200个字符,大概一篇短文那么多。存几条记录就满了,想存新的就得删旧的。
这显然不行。我要的是一个能连续工作几个月、甚至一年的助手,不是每天失忆的傻子。
研究了一下底层代码,发现限制是硬编码在工具文件里:
python
def __init__(self, memory_char_limit: int = 2200, user_char_limit: int = 1375):
但它实际上从配置文件读参数,只是从来没配过。加了一行配置:
yaml
memory:
memory_char_limit: 220000
user_char_limit: 137500
即时生效,不用重启。从2200到22万,从1375到13.75万——整整100倍。
现在它终于能记住东西了。这是所有”养成”的基础——脑子不好,教再多也没用。
二、然后是”会干活”的问题
能记住只是第一步。更关键的是,怎么让每一次”折腾”变成下一次的”不用折腾”。
每一件事几乎都经历了同样的过程:翻车→分析→修复→固化。
🔧 PDF字体方块
第一次生成PDF,中文字体全是□□。折腾半天发现是Matplotlib字体缓存损坏,清了缓存、指定字体就好了。但第二天再做,同样的问题又来了——因为昨天的解决方案没被记住。后来把完整流程写成了”技能”文件:清缓存→设字体→自检→生成,每一步都有标准模板。从那以后,PDF字体再也没出过问题。
🔧 OCR识别不准
图片里的文字识别出来乱七八糟。试了两种OCR服务,发现光靠OCR不行,得加一道AI后处理。写了个流水线:OCR提取文字 → DeepSeek做结构化整理/纠错/翻译,一套脚本搞定。现在任何图片扔进去,出来就是整齐的结构化内容。
🔧 发图收不到
开头那个故事。教训是:不能假设平台的某个功能一定可靠。宁可多走一步(上传CDN),不要赌它能直达。
每一个这样的故事,最后都转化成了一份SKILL.md文件。现在我的爱马仕有将近40个这样的技能,覆盖从PDF生成到图片处理的方方面面。每个技能都包含:出过什么问题、为什么出、怎么修的、下次怎么避免。
三、最难的是”方法论”
技术问题都好解决,记忆不够就扩容量,流程不对就写技能。最难改变的是它的做事方式。
早期它的风格是”你说什么我做什么”。但很多复杂任务,直接动手很容易跑偏。比如画架构图,第一次配色辣眼睛,第二次布局挤在一起。折腾两轮才发现,问题出在它没想清楚就动手了。
我加了一个规矩:复杂任务必须先展示推理链。
比如要生成一份战略报告,它会让”第19团”(一个专门负责战略审核的虚拟部门)先过一遍思路:要分析什么、用什么框架、预期产出是什么。我看完没问题,它再动手。从”先干再说”变成了”先想清楚再干”。
还有一个更重要的变化,它开始主动问我:”这个流程要不要固化下来?”
以前是我发现了问题,让它修。现在是它做完一件事,自己判断”这个以后可能还会用到”,然后问我能不能写成技能。
我知道,这东西开始有”职业素养”了。
四、那些反复教的”基本功”
有些事教了很多遍,到现在才算真正学会。
架构图的三次迭代
第一版配色辣眼睛。我说不行。
第二版布局挤在一起。我说不行。
第三版它学聪明了,先发了个设计草稿让我确认,点头了才正式画。之后再也没翻过车。
会话断点续传
有次写了两千多字的长文,写到一半会话断了。我对着空白窗口,心凉了半截。后来它告诉我:复杂任务每完成一步都会记录断点到文件,哪怕会话重置也能恢复进度。现在凡是超过5步的任务,都会自动注册Task-ID,每一步有记录。丢了也不怕。
安全案例不能说谎
有次它引用化工安全事故案例,把两个事故的细节拼在一起了。我严肃地告诉它:引用历史案例,必须基于官方报告原文,绝对不能拼接编造。不确定的要说”置信度不足”,宁可少说,不可错说。这个原则写进了永久记忆,现在只要是安全相关的引用,它都会先标注信息来源和置信度。
五、现在它是什么水平?
不能说它完美了。还有很多问题要解决,还有很多流程要完善。
但有些变化是实实在在的:
– 记忆:2200字符 → 22万字符,基本够用了
– 技能库:从0到40个固化技能,覆盖PDF、图表、OCR、发图、法律文本分析……
– 做事方式:复杂任务先展示推理链,简单任务直接执行,做完了会问要不要固化
– 跨会话能力:今天教的东西,明天不会忘。上周解决的问题,这周不需要重新来
从技术角度看,这些都是很简单的改进——改个配置文件、写几个Python脚本、加几行判断逻辑。但实际效果是,这个AI从”每次见面都是陌生人”变成了”老朋友”。
六、还在路上
下一步想让它有更强的自学习能力。不只是我告诉它它才学,而是能从每一次对话中自动提取有价值的信息存下来。
再下一步,想让它能跨会话地持续成长。这周比上周强,下个月比这月强,一年以后应该是一个完全不一样的AI。
这些事还在摸索。说到底,养一个AI和教一个新人没什么本质区别,都需要耐心、重复、纠错,以及最重要的:把每一次翻车变成下一次的保险。
它的记忆里现在存着这样一段话,是我说的:
“重要内容必须永久记忆作为进化基础……新固化的流程只是辅助,最关键的是记忆要能追溯所有已解决的问题和决策。”
这大概就是”养成”的核心:不是靠一次版本升级,而是靠每一天、每一次对话、每一个错误的累积。
回到开头那个发图的故事。
在我第七次说”没收到”之后,爱马仕终于用CDN上传的方式把三张图发了过来。三层系统架构、控制闭环数据流、安全防护加IP规划,这是我们工业智能系统的设计蓝图。
但比那三张图更重要的,是它在这次折腾中学到的东西。它写了一个技能,我存了一笔记忆,它不会再忘记怎么发图了。
夜雨聆风