炼己成丹:探索AI共生新范式
最近两年,AI的发展速度远超所有人的预期,每个人可以把自己的理念、方法论、流程、检查点和经验教训固化下来,只要你能说清楚,AI就可以使用你的工作标准去重复解决类似问题,比如做计划、执行和检查。就像黑客帝国里面的数字分身一样,重复利用算力资源形成自己的多个副本,是一个非常有效的办法。
按照现在的说法,把自己“炼成丹”。

把自己深思熟虑的经验通过文字性的描述记录下来,可以冷静的思考,可以不断审视、批判和对标,找到自己的弱点和缺项,并且不断寻求改进积累。常说好记性不如烂笔头,这就是一个方式,可以把自己的灵感积累下来。
不管在哪个领域,追求更快、更好是一个持续的目标。从Vibe Coding开始,在软件开发领域自动化开发的程度越来越高。在这里,我做了一些尝试,对于如何把自己“炼成丹”,如何和AI共生,有些思考分享给大家。
一、从“键盘侠”到“人肉调度”
现在有很多CLI或集成的开发工具,能极大地提高工作效率。最初用Claude Code之内的命令行工具或者图形界面开发工具,很多场合还是即兴开发(你想到哪干哪,AI想怎么干就怎么干),尤其是处理遗留系统的代码,时间占用很多并且思维非常碎片化。说实话,也不适应输入文字、然后盯着屏幕等待按回车键,这样机械而单调的工作模式。
从业这么多年,我最需要的还是一套端到端的、系统化工具,能够自上而下的分解问题并且保持不同阶段工作的有效性和一致性。Claude Code针对软件开发测试做了一些优化,但其缺省不具备需求调研分析、复杂系统分解的能力,还不太适合按照软件工程的思路从无到有搭建一个系统。AI就像一群非常高效但极其短视的打工人,如果没有清晰的架构、没有测试门禁、没有变更管理,它们必然把项目搞成一锅粥。
为了解决这个问题,初期我设计了一个线下的“双AI流水线”:
·DeepSeek 负责宏观设计——需求分析、技术选型、任务拆分,它很擅长,一口气能输出几十个细化任务。
·Claude Code 负责微观实现——读取DeepSeek写好的任务提示词,逐个编写代码、测试、文档。
听起来很完美对吧?可实际跑起来非常繁琐:
·复制粘贴地狱:DeepSeek生成150+个任务提示词,我一个一个复制出来,存成.md文件,再拖进Claude Code。一次变更就要重做这一套。即使后面用工具批量下载对话记录,使用代码自动拆分成任务,搬运到Claude Code还是很费时,得不断查看Claude Code是否可以开始下一个任务了。
·机械式回车:Claude Code(免费版)执行每个任务前都要我确认“是否允许运行命令”“是否覆盖文件”,我不看着它就不动;我一走开,它就停。连路途都得用手机盯着等待按回车键,一天下来,阿里的Coding Plan居然消耗不了1%。
·上下文脱节:DeepSeek和Claude Code有各自的工作空间和上下文,他们之间无法直接沟通,无法直接对齐。在需要变更或者扩展功能时,需要人工把Claude Code的现状反馈给DeepSeek,DeepSeek再做分析并生成提示词。
OpenAI 提出了Harness Engineering思想,通过约束、工具和验证门禁让Agent更可靠,但它更像一套基础设施框架。我需要的是一个从整个现状调研、竞品分析、算法研究到子系统拆分、技术选型、任务分解、提示词编写到设计、开发、系统集成、文档编写,甚至运维和代码迭代完善的一整套流程。
二、构想:把软件工程经验炼成“丹”,让AI自己跑流程
有很多人在编写Skill,我想我也得动手试试了。于是我设想:让AI模仿整个软件工程的经典过程,而不仅仅是模仿编码。我把自己多年积累的“隐性经验”——怎么分析痛点、怎么选型、怎么拆分粒度、怎么保证一致性——拆解成一套固定的、可自动化执行的流程、角色和提示词。
最初,我尝试在OpenClaw来定义智能体和Skill,但OpenClaw几乎每次发布都有新问题,并且其内部并没有对软件开发测试做建模和优化。折腾了一个多月,后面我又回到了Claude Code,最终诞生的就是“奇点方法论”。这套方法论本质是把个人经验炼成“可执行的丹”——用文字固化思考,用流程约束AI,用检查点积累教训,让机器替人完成重复劳动,而人专注在架构、选型和创意决策上。
阶段目标:把软件工程经典流程(需求→技术调研→架构→原型→任务拆分→提示词→审计→执行→变更)固化为8个AI子代理,每个代理专注一个环节,强制输出结构化文档,彻底消除AI的上下文混乱。将模糊需求原子化为15-30分钟可执行的提示词任务。文档驱动流程,子代理之间不共享对话记忆,只传递Markdown文件;人工只在5个关键节点做“继续/修改”的轻量审核,其余全自动。最后由ralphex引擎在独立Git worktree中并行调度Claude Code,实现代码、测试、文档的一键交付。
8个专业化子代理(Sub agent):
需求分析师:痛点挖掘、用户角色、业务场景、算法需求识别
技术调研员:开源组件对比、算法论文/公式/伪代码、风险决策
架构师:子系统划分、数据库/API设计、原型描述、安全部署
原型设计师:生成可内部跳转的多页面HTML原型,用于演示确认
任务拆分专家:15-30分钟原子任务、依赖关系、并行标记
提示词工程师:YAML元数据+8段结构,每个任务一个独立提示词
审计子代理:七维一致性检查,通过后生成ralphex计划文件
变更管理器:需求/技术变更的影响分析和增量更新
每个子代理都有专属的系统提示词和自检报告,有前后节点工作关系,并且强制要求引用上一阶段输出的文档,减少“AI失忆”。我只需要在5个关键节点进行确认和修改:需求、技术选型、架构、原型、任务大纲。

三、真实效果:能全自动,但也踩了坑
这套方法论我已经在工业边缘网关等项目上跑通了,感觉效率还是很可观的,确实可以实现从概念到计划的大部分工作自动化。但还有一些问题。感觉他可以起到团队中猪八戒的角色,和一个爱偷懒、想当然的人格很像,人的干预还是少不了。主要的问题如下:
1、Claude + Qwen 3.6的组合任何存在能力不足
他会明显的忽略错误,有时候单纯为了当前完成任务会走捷径,自作主张“快速实现”、“跳过测试用例”,甚至有时候不去验证环境,甚至主观臆断“服务不存在”、“Docker无法访问”,也不去网络上求助。并且明显缺乏对一些最佳实践的遵循,比如不使用单例、把用户账号或网络地址硬编码在代码、将类似的代码复制好几份。好几次问题解决不了,复制给Deepseek求助,让他顿悟。
2、ralphex 的质量控制缺陷相同的提示词,ralphex 明显比Claude Code自己执行快很多,不确定执行过程中工作量是否有差异。但很明显,有时候一个任务明明执行失败了(比如测试没通过),ralphex却自顾自地标记为“已完成”。这就导致后面集成测试时各种崩溃。看来集成测试得自己手动重过,仔细观察,多测试几遍,即使测试通过每次大概率还能发现新问题。需要反复不断要求真实测试,不能mock、不能想当然,要回归、不能跳过,把重要决策写入记忆…当然,把问题和要求说清楚,并且自己设计特定测试用例,对工作会有很大的促进。
3、ralphex 不稳定
ralphex 还不是很稳定。有时候报错就停在那不动,浪费了有效工作时间。并且有时候因为时间段内的API调用耗尽,Claude Code会卡住,relphex没有自动重试功能。此外,最近Claude Code在上下文超出时,需要人工Compact,我还没有发现自动压缩的方法。
总之,AI自动化不是100%,也不是万能的,底层工具的稳定性、对复杂环境(数据库、消息队列、依赖服务)的感知能力还很脆弱。全自动之路还很长,但至少我们已经在路上了。
OpenAI提出的Harness Engineering提供了一套底层“马具”——约束、验证门禁、状态管理。它就像赛车的底盘和悬挂,而我的方法论更像立交桥和红绿灯。两者天然互补。我相信,后面会有产品按照软件工程、石油工程等流程,构建真正的端到端AI平台,供给数字化员工。我期待这一天早日到来。
四、AI时代,寻找人机共生的新范式
经过这几个月的折腾,我逐渐看清了一个趋势:AI是工具,不会取代有经验的程序员,但它会彻底重塑程序员的技能模型。所有行业均为如此。
1、AI会抬高能力的下限,但上限受限人类将来一个刚入行的初级工程师,借助AI也能写出看起来不错的基础代码,进行常规的接口设计。但真正决定软件成败的——系统边界划分、关键技术选型、非功能取舍(性能、安全、可维护性)——还是只能由人来决策。AI可以给你十个架构选项,但最终选哪一个,需要你对业务、团队、技术趋势有深刻理解。
2、人类必须拥有更宏观的视野和跨专业技能过去我们可能只需要精通一门专业、一个体系、一套标准。对于IT从业人员,现在你需要懂一点产品思维(不然怎么给AI提准确需求?)、懂一点运维(否则AI生成的部署脚本稍微一改就跑不通)、懂一点数据(否则AI帮你设计的数据库就是一锅粥)。跨专业、跨界的能力,面向结果的端到端定义问题、分析问题、解决问题的能力正在变成核心竞争力。
3、必须掌握足够的能力,才能驾驭好AIAI目前在高度抽象的设计模式、并发控制、复杂的业务规则推导等方面,仍然相对容易出错,很多决策缺乏深度优化。所以,保留自己的“算法修改能力”、“技术选型决策能力”和“代码审查能力”至关重要。AI是你的团队成员,你一个键就可以唤起无数个专家听你派遣,你的工作层级会越来越高,工作不是越来越少,而是更宏观、要审查的东西更多更复杂,责任越大。你必须要有更大的视角,解决更复杂问题的决心和勇气。
4、寻找自己独特的AI共生新范式
每个人都需要找准自己的定位,和AI共生;要发挥自己的特长,从自己的性格和兴趣中寻找比较优势;提高自己的工作定位,不要再把自己当做团队成员,而是团队负责人,对标现在的管理人员或高级专业人员。你没有AI快,但你要比他看得远;你没有AI记忆更强大,但你要有更加多元的判断力。这是新的田忌赛马的游戏,不要让自己成为以你为中心的AI虚拟团队的那块短板。
我越来越体会到:机器在消耗电能,人也在消耗糖分和精力。最终,能量都转化为了“智能”。现在有机物可以燃烧用来发电,二氧化碳结合电能可以转换为淀粉,机器和人类的生存基础在慢慢接近。如果人类转换的智能不能强于机器转换的智能,那人的价值和生存根基可能会被动摇。但在这种转化中,人类最宝贵的是好奇心和深度思考的能力——这些东西不是靠“喂数据”能得到的,而是靠不断质疑、不断重构、不断失败再爬起来获得的。这种“炼丹”思维,并不仅限于软件开发。任何行业、任何岗位,都可以把自己的经验按照场景“流程化”、“标准化”,让AI成为你的数智分身,打造私人订制的数智军团。我们不是被AI替代,而是通过AI释放更多的精力去思考、去学习、去创造、去享受生活。
所以我的建议是:不要只满足于当一个“提示词工程师”和“回车键大师”,你要时刻抬起头看看整个系统,问问自己一些和技术无关的问题:“客户的痛点在哪?”“如何才能创造价值?”“为什么这样拆分更合理?”“系统怎么才能用起来?”“数据源在哪?”“如果上线后出了问题,哪个环节最容易爆炸?” 这些宏观视角和风险意识,是AI短期内无法替代的。制造焦虑不可取,提升自己才是正道。
夜雨聆风