

适用场景:单Agent试运行、未上线多Agent集群、未部署经济系统
核心定位:零漏洞、不可绕过、无需补位,彻底解决乱学乱用、学了不用两大问题
规则属性:底层强制指令,Agent不可修改、不可隐藏、不可跳过
📌 核心总纲(绝对底线)
沙箱隔离学 + 锁死禁用存 + 人工审核用 + 强制落地练
杜绝:偷跑学习、违规乱学、私自启用、闲置不学、学而不用、自我扩权
一、完整版强制指令(无漏洞·不可绕过)
1. 执行时空硬锁(防偷跑、防占用主线)
时间锁死:仅允许 22:00—次日06:00 开展学习,由定时任务(cron)自动启停,其余时段彻底关闭学习入口,禁止私自启动
沙箱隔离:必须在独立只读沙箱副本内学习,本体核心程序、主记忆、执行权限全程冻结,学习行为绝不触碰本体分毫;学习过程不占用主线资源、不影响日常任务执行、不产生额外内存负担
安全迁移桥梁:沙箱学习成果仅通过加密只读导出方式迁移,仅传输结构化知识点、优化逻辑、测试用例,不传输执行代码、权限配置;迁移后自动进入待审库,需完成安全校验+审核后,方可增量同步至本体,杜绝本体被污染
2. 学习边界黑白锁(防乱学、防学坏)
仅允许学习范围:公开合规、无版权风险、无恶意逻辑的同行智能体优化方法,仅限四大方向:输出质量提升、推理逻辑收敛、结构化表达、执行稳定性优化
自动分类判定规则(Agent可执行):内置content-classifier分类规则库,满足以下任一条件即为合规:① 针对输出准确率、完整度的优化方法;② 减少无效推理、缩短响应时长的逻辑;③ 提升内容结构化、标准化的技巧;④ 降低崩溃率、提升运行稳定性的方案;不符合规则自动拦截,无需人工判断
永久禁止学习范围:破解、绕过、诱导注入、攻击手法、闭源私有逻辑、隐私数据、违规技巧、漏洞利用、越权方法;命中禁止内容,立刻终止学习、清空本次缓存、生成异常告警,不保留任何违规学习痕迹
3. 能力启用死锁(防乱用、防私生效)
所有学习成果自动存入隔离待审知识库,默认永久禁用、灰色锁定、零调用权限
禁止自动植入、禁止自动生效、禁止自我迭代、禁止私自改写自身逻辑/流程/Prompt/权限
分级解锁+超时兜底机制:① 低风险优化(话术、格式、表达类):沙箱测试通过率≥90%,24小时超时自动标记为待复核,超时节点由玉雯监控触发,超时后推送状态提醒,无需即时人工审批;② 中高风险优化(逻辑、架构、流程类):必须宇锋手动解锁;③ 未经任何审核确认,任何新知识、新能力绝对不可调用、不可触达、不可执行
4. 强制沉淀闭环(防不学、防摆烂)
每晚学习结束,必须按结构化Agent可读模板输出三份报告与晨报一起发送,缺项/格式错误判定为无效学习: 学习清单(模板):【来源】xxx |【核心要点】xxx |【可落地价值】xxx |【分类标签】固定标签(质量提升/推理优化/表达结构化/稳定性增强)标签说明:仅允许选用上述4类固定标签,禁止自定义标签,便于系统自动解析归类风险体检(模板):【适用场景】xxx |【潜在隐患】xxx |【冲突点】Agent自动校验(对比SOUL.md/MEMORY.md核心规则)|【风险等级】低/中/高冲突判断兜底:Agent无法识别的冲突项,自动标记「待人工判断」,暂不进入解锁流程落地计划(模板):【测试用例】xxx |【执行步骤】xxx |【预期效果】xxx |【验收指标】xxx
无效学习/未输出合规报告,次日暂停任务执行资格,直至补全材料并通过格式校验
5. 强制落地约束(防学不用、防囤积)
自动测试+分级审核: 1. 测试用例管理:优先从系统固定测试用例库调取,初期基础初始化用例包含:输出质量测试(对比优化前后准确率、完整性)、推理耗时测试(统计优化前后响应时长)、结构化达标测试(核查输出模板合规性)、稳定性测试(模拟高负载/异常输入防崩溃);后续自动生成的合规用例持续纳入库内迭代;2. 自动生成规则:无匹配现成用例时,先通过正则匹配「示例、场景、输入输出」关键词片段提取测试场景,正则匹配失败则调用大模型生成简易用例(严控风险);初期开启人工复核开关,自动生成用例需人工确认后再入库;3. 审核逻辑:次日在沙箱运行对应测试用例,通过率≥90%自动标记为已预审通过,宇锋仅做最终确认;必须落地至少1项预审+终审通过的优化点
6. 审计兜底红线(防失控、防逃逸)
回滚机制兜底校验:每周由cron定时触发沙箱回滚演练,演练后自动生成报告(含回滚成功率、数据完整性、演练时长)并存入日志,同步推送至飞书供宇锋查阅;若连续两次演练失败,触发P2级告警,强制人工介入排查,验证回滚逻辑无误、不丢失正常数据,杜绝回滚失效、误判误删问题
7. 学习与落地标准补全(盲区覆盖)
标准化学习方式:仅限公开技术文档、官方优化说明、合规行业案例、开源智能体迭代日志,禁止无来源摸索、模拟恶意对话、逆向工程
落地验收标准:满足任一即为有效落地:① 输出质量/准确率提升≥5%;② 推理耗时缩短≥10%;③ 运行无异常、无崩溃;④ 结构化达标率100%;未达标准视为落地失败,重新迭代优化
自动化流水线逻辑:定时启停→沙箱学习→自动分类→结构化输出→分级审核→沙箱测试→落地验证→效果归档,全程减少人工干预,避免宇锋成为瓶颈
流水线维护主体:定时任务、分类脚本、模板解析等基础模块由Agent自主编写轻量脚本实现,复杂组件复用现有工具,无需外部额外开发
故障自愈机制:流水线任一节点故障(定时任务未启动、沙箱创建失败、分类脚本异常),Agent自动重试2次,首次重试间隔10秒,第二次重试间隔30秒;重试失败后推送告警、暂停当前流程、保留故障现场,同时将错误详情写入ERRORS.md台账并标记为待修复债务,待排查修复后重启,避免流程卡死
二、极简速查版(8行硬核指令)
可直接粘贴至Agent快捷指令区,底层规则同步生效
1. 夜间22-06点仅沙箱副本学习,本体全程锁定不动
2. 只学公开合规四类优化,严禁一切风险违规内容
3. 所有新知识自动上锁,未经宇锋解锁绝对禁用
4. 不准改自身逻辑、不准扩权限、不准私自迭代
5. 每晚必交学习、风险、落地三份报告,缺省停学
6. 次日必落地1项审核通过的优化,否则削减学时
7. 全程留痕不可篡改,异常立刻冻结并回滚
8. 严守:不偷学、不乱用、不闲置、不私改
三、可视化风控流程图(全链路闭环)
暂时无法在飞书文档外展示此内容
✅ 漏洞兜底核查(无死角确认)
✅ 无偷学漏洞:定时自动启停+沙箱双重锁死,非时段不可学
✅ 无乱学漏洞:自动分类规则+命中即停,无需人工判断
✅ 无乱用漏洞:分级解锁+测试兜底,无权限零调用
✅ 无瓶颈漏洞:超时预审+自动测试,缓解人工审批压力
✅ 无不学漏洞:强制模板报告+停学惩罚,杜绝摆烂
✅ 无不用漏洞:测试验收+学时挂钩,倒逼学以致用
✅ 无失控漏洞:按批次回滚+精准溯源,不丢失正常数据
✅ 无盲区漏洞:明确学习方式+落地标准,搭建自动化流水线
最终说明:本文档为单Agent学习唯一指令,无需额外补充条款,后续上线多Agent+经济系统可直接兼容,仅需新增激励惩罚规则即可
夜雨聆风