AI Agent 日报 | 2026.04.20

每日 AI Agent / LLM 最新动态，专注项目解析与实用洞察

今日头条

AI Agent 自进化再升级！Manifest+Evolver+GameStudios+BlueData 四路并进（2026.04.20）

一、GitHub 热点项目

1. Manifest — 个人 AI Agent 的智能模型路由器 ⭐ +497

项目地址：https://github.com/mnfst/manifest\ Star：5.1k ⭐｜许可：MIT｜语言：TypeScript

解决的核心问题

个人 AI Agent（如 OpenClaw、Hermes）在调用 LLM 时面临两难：简单问题用顶级模型浪费钱，复杂问题用廉价模型效果差。Manifest 站在 Agent 和 LLM 提供商之间，用评分算法自动判断每个请求的复杂度，并将请求路由到最便宜且足够用的模型。

技术原理

核心是一套 23 维评分算法（执行时间 < 2ms），将请求分为四档：

复杂度	路由策略	代表场景
Simple	轻量快速模型	简单问答、格式化
Standard	中等性能模型	常规对话、摘要
Complex	高性能模型	代码生成、分析
Reasoning	顶级推理模型	复杂推理、多步规划

同时支持：

• 300+ 模型的多提供商管理
• 订阅复用：ChatGPT Plus、Claude Max 等可直接利用
• 成本追踪：完整记录每次路由的 token、成本与响应时间
• 本地部署：Docker 一行安装，数据完全本地

核心价值

• 节省高达 70% 的 API 成本（无需任何额外思考）
• 比 OpenRouter 更适合个人场景：完全开源（MIT）、无 5% 收费、数据更隐私
• 低于 2ms 的路由延迟，Agent 无感知

适用人群

• 运行多个个人 AI Agent 的用户
• 需要严格控制 API 成本的独立开发者
• 有隐私需求（不想让提示词经过第三方服务器）的用户

2. Claude Code Game Studios — 49 个 AI 智能体的游戏开发工作室 ⭐ +704

项目地址：https://github.com/donchitos/claude-code-game-studios\ Star：13.4k ⭐｜Fork：1.9k｜许可：MIT｜语言：Shell

解决的核心问题

单个 AI 编程会话缺乏结构——没人阻止你硬编码魔法数字、跳过设计文档或写出无人能维护的"意大利面代码"。Claude Code Game Studios 将单个 Claude Code 会话转变为一个完整的游戏开发工作室，用 49 个 AI 智能体模拟真实工作室的层级协作。

技术架构

三层委托模型：

Tier 1 — 导演（Opus 模型）
  creative-director / technical-director / producer

Tier 2 — 部门主管（Sonnet 模型）
  game-designer / lead-programmer / art-director
  audio-director / narrative-director / qa-lead
  release-manager / localization-lead

Tier 3 — 专家（Sonnet/Haiku 模型）
  gameplay-programmer / engine-programmer / ai-programmer
  network-programmer / tools-programmer / ui-programmer
  ... 等 37 个专业角色

协作机制：

• 垂直委托：导演→主管→专家层级传递
• 横向协商：同级别智能体相互咨询
• 冲突升级：争议向上提交到共同父级
• 变更传播：跨部门变更由 producer 协调

安全护栏（12 个 Hooks）：

Hook	触发时机	功能
`validate-commit.sh`	提交前	检测硬编码值、TODO 格式、JSON 有效性
`detect-gaps.sh`	会话开始	检测新项目缺失设计文档
`session-start.sh`	会话开始	显示当前分支和最近提交
`log-agent.sh`	代理启动	审计跟踪

协作协议（需用户授权）：

1. 智能体提问而非直接行动
2. 提供 2-4 个选项及优缺点
3. 用户做最终决策
4. 展示草稿而非直接完成
5. 未经用户批准不写入任何内容

适用场景

• 独立游戏全流程开发（概念→发布）
• 游戏原型快速验证
• 多人系统协作开发
• 发布前完整检查清单

适用人群

• 个人独立游戏开发者
• 小型游戏团队（2-5 人）
• 希望用 AI 模拟完整工作室流程的创作者

3. Evolver — GEP 驱动的 AI Agent 自进化引擎 ⭐ +527

项目地址：https://github.com/evomap/evolver\ Star：5.5k ⭐｜Fork：535｜许可：GPL-3.0｜语言：JavaScript

解决的核心问题

AI Agent 的提示词调整依赖人工经验，每次修改都是"临时补丁"——无法审计、无法复用、无法追踪进化历史。Evolver 将提示词进化转化为可管理的协议化流程，通过基因进化协议（GEP）让 Agent 自我发现问题并生成可追溯的修复指令。

技术原理

基因组进化协议（GEP）工作流：

1. 日志扫描 → 分析 memory/ 中的运行时错误和模式
2. 基因选择 → 从 assets/gep/ 选择最匹配的 Gene 或 Capsule
3. GEP 提示 → 输出严格遵循协议的进化指令
4. 事件记录 → 生成可追溯的 EvolutionEvent（events.jsonl）

基因/胶囊系统：将可复用的进化资产存储在 assets/gep/ 目录，基因（Gene）处理单一问题，胶囊（Capsule）封装完整工作流。

四种进化策略：

策略	创新	优化	修复	适用场景
balanced	50%	30%	20%	日常运营
innovate	80%	15%	5%	快速发布新功能
harden	20%	40%	40%	重大变更后稳定性
repair-only	0%	20%	80%	紧急缺陷修复

安全模型：仅允许 node/npm/npx 前缀命令，禁止反引号、$(...)、shell 操作符，每条命令超时 180 秒。

适用人群

• 需要管理大量 Agent 提示词的开发团队
• 有合规审计需求的企业（进化过程完整可追溯）
• 希望 Agent 能自动从错误中学习的运维团队

二、arXiv 热门论文

1. RadAgent：工具调用型 AI 智能体，逐步解读胸部 CT

论文：arXiv:2604.15231^[1]\ 作者：Roscchewitz et al.（多机构联合研究）

核心问题

现有医学影像 VLM（视觉-语言模型）将放射科医生 relegate 为"被动观察者"——只能看到最终输出，无法检查推理过程。RadAgent 引入逐步推理轨迹，让每份 CT 报告都附带中间决策和工具调用日志，实现可解释的医学 AI。

技术原理

RadAgent 将胸部 CT 解读从"黑盒输出"转变为显式工具增强的迭代推理：

1. 工具调用机制：智能体主动调用图像切片分析、区域测量等工具获取推理依据
2. 逐步推理：将报告生成拆解为多个中间步骤，每步产生明确决策
3. 完整日志：记录每一步的决策依据、工具调用参数与返回结果

实验结果

指标	相对提升
宏观 F1	+36.4%（+6.0 个点）
微观 F1	+19.6%（+5.4 个点）
对抗性条件	+41.9%（+24.7 个点）
忠实度（Faithfulness）	37.0%（基线为 0%）

适用人群

• 放射科医生：可解释推理轨迹辅助诊断，降低对"黑盒 AI"的不信任
• 医学影像 AI 研究人员：Agent 架构引入 3D 医学影像的分析范式参考
• 医疗 AI 产品开发者：满足临床"可解释性 + 安全性"强监管需求的合规路径

2. Blue Data Intelligence Layer：流数据与 Agent 驱动的多源多模态应用

论文：arXiv:2604.15233^[2]

核心问题

多源多模态数据应用（如工业监控、智慧城市、医疗物联网）面临数据孤岛挑战：流数据处理、多模态融合、Agent 推理三者割裂，缺乏统一框架。

技术原理

Blue Data Intelligence Layer 构建了一个三层架构：

流数据接入层 → 多模态融合引擎 → AI Agent 决策层

• 流数据接入：支持 Kafka、MQTT 等工业协议的统一接入
• 多模态融合：视觉、时序、文本跨模态对齐
• Agent 决策：基于融合数据的实时推理与响应

适用场景

• 工业 IoT 实时监控与异常检测
• 智慧城市多源数据融合
• 医疗物联网多模态患者监护

三、每日总结

类别	项目/论文	核心亮点
智能路由	Manifest	23维评分算法，2ms内判断复杂度，节省70% API成本
多Agent协作	Claude Code Game Studios	49个AI智能体三层委托，游戏开发完整工作室
自进化Agent	Evolver	GEP基因组进化协议，提示词变更可审计可复用
医疗AI Agent	RadAgent	逐步推理+工具调用，胸部CT报告忠实度达37%
多模态流数据	Blue Data Intelligence Layer	工业IoT多模态实时融合与Agent决策

本文档由 AI 自动生成，每日 08:30 更新。\ Agent 应用开发商务合作，欢迎邮件联系 yangjie@sourcedreamai.com

引用链接

[1] arXiv:2604.15231: https://arxiv.org/abs/2604.15231
[2] arXiv:2604.15233: https://arxiv.org/abs/2604.15233