每日 AI Agent / LLM 最新动态,专注项目解析与实用洞察
今日头条
AI Agent 自进化再升级!Manifest+Evolver+GameStudios+BlueData 四路并进(2026.04.20)
一、GitHub 热点项目
1. Manifest — 个人 AI Agent 的智能模型路由器 ⭐ +497
项目地址:https://github.com/mnfst/manifest\ Star:5.1k ⭐|许可:MIT|语言:TypeScript
解决的核心问题
个人 AI Agent(如 OpenClaw、Hermes)在调用 LLM 时面临两难:简单问题用顶级模型浪费钱,复杂问题用廉价模型效果差。Manifest 站在 Agent 和 LLM 提供商之间,用评分算法自动判断每个请求的复杂度,并将请求路由到最便宜且足够用的模型。
技术原理
核心是一套 23 维评分算法(执行时间 < 2ms),将请求分为四档:
| 复杂度 | 路由策略 | 代表场景 |
|---|---|---|
| Simple | 轻量快速模型 | 简单问答、格式化 |
| Standard | 中等性能模型 | 常规对话、摘要 |
| Complex | 高性能模型 | 代码生成、分析 |
| Reasoning | 顶级推理模型 | 复杂推理、多步规划 |
同时支持:
- • 300+ 模型的多提供商管理
- • 订阅复用:ChatGPT Plus、Claude Max 等可直接利用
- • 成本追踪:完整记录每次路由的 token、成本与响应时间
- • 本地部署:Docker 一行安装,数据完全本地
核心价值
- • 节省高达 70% 的 API 成本(无需任何额外思考)
- • 比 OpenRouter 更适合个人场景:完全开源(MIT)、无 5% 收费、数据更隐私
- • 低于 2ms 的路由延迟,Agent 无感知
适用人群
- • 运行多个个人 AI Agent 的用户
- • 需要严格控制 API 成本的独立开发者
- • 有隐私需求(不想让提示词经过第三方服务器)的用户
2. Claude Code Game Studios — 49 个 AI 智能体的游戏开发工作室 ⭐ +704
项目地址:https://github.com/donchitos/claude-code-game-studios\ Star:13.4k ⭐|Fork:1.9k|许可:MIT|语言:Shell
解决的核心问题
单个 AI 编程会话缺乏结构——没人阻止你硬编码魔法数字、跳过设计文档或写出无人能维护的"意大利面代码"。Claude Code Game Studios 将单个 Claude Code 会话转变为一个完整的游戏开发工作室,用 49 个 AI 智能体模拟真实工作室的层级协作。
技术架构
三层委托模型:
Tier 1 — 导演(Opus 模型)
creative-director / technical-director / producer
Tier 2 — 部门主管(Sonnet 模型)
game-designer / lead-programmer / art-director
audio-director / narrative-director / qa-lead
release-manager / localization-lead
Tier 3 — 专家(Sonnet/Haiku 模型)
gameplay-programmer / engine-programmer / ai-programmer
network-programmer / tools-programmer / ui-programmer
... 等 37 个专业角色协作机制:
- • 垂直委托:导演→主管→专家层级传递
- • 横向协商:同级别智能体相互咨询
- • 冲突升级:争议向上提交到共同父级
- • 变更传播:跨部门变更由 producer 协调
安全护栏(12 个 Hooks):
| Hook | 触发时机 | 功能 |
|---|---|---|
validate-commit.sh | 提交前 | 检测硬编码值、TODO 格式、JSON 有效性 |
detect-gaps.sh | 会话开始 | 检测新项目缺失设计文档 |
session-start.sh | 会话开始 | 显示当前分支和最近提交 |
log-agent.sh | 代理启动 | 审计跟踪 |
协作协议(需用户授权):
- 1. 智能体提问而非直接行动
- 2. 提供 2-4 个选项及优缺点
- 3. 用户做最终决策
- 4. 展示草稿而非直接完成
- 5. 未经用户批准不写入任何内容
适用场景
- • 独立游戏全流程开发(概念→发布)
- • 游戏原型快速验证
- • 多人系统协作开发
- • 发布前完整检查清单
适用人群
- • 个人独立游戏开发者
- • 小型游戏团队(2-5 人)
- • 希望用 AI 模拟完整工作室流程的创作者
3. Evolver — GEP 驱动的 AI Agent 自进化引擎 ⭐ +527
项目地址:https://github.com/evomap/evolver\ Star:5.5k ⭐|Fork:535|许可:GPL-3.0|语言:JavaScript
解决的核心问题
AI Agent 的提示词调整依赖人工经验,每次修改都是"临时补丁"——无法审计、无法复用、无法追踪进化历史。Evolver 将提示词进化转化为可管理的协议化流程,通过基因进化协议(GEP)让 Agent 自我发现问题并生成可追溯的修复指令。
技术原理
基因组进化协议(GEP)工作流:
1. 日志扫描 → 分析 memory/ 中的运行时错误和模式
2. 基因选择 → 从 assets/gep/ 选择最匹配的 Gene 或 Capsule
3. GEP 提示 → 输出严格遵循协议的进化指令
4. 事件记录 → 生成可追溯的 EvolutionEvent(events.jsonl)基因/胶囊系统:将可复用的进化资产存储在 assets/gep/ 目录,基因(Gene)处理单一问题,胶囊(Capsule)封装完整工作流。
四种进化策略:
| 策略 | 创新 | 优化 | 修复 | 适用场景 |
|---|---|---|---|---|
| balanced | 50% | 30% | 20% | 日常运营 |
| innovate | 80% | 15% | 5% | 快速发布新功能 |
| harden | 20% | 40% | 40% | 重大变更后稳定性 |
| repair-only | 0% | 20% | 80% | 紧急缺陷修复 |
安全模型:仅允许 node/npm/npx 前缀命令,禁止反引号、$(...)、shell 操作符,每条命令超时 180 秒。
适用人群
- • 需要管理大量 Agent 提示词的开发团队
- • 有合规审计需求的企业(进化过程完整可追溯)
- • 希望 Agent 能自动从错误中学习的运维团队
二、arXiv 热门论文
1. RadAgent:工具调用型 AI 智能体,逐步解读胸部 CT
论文:arXiv:2604.15231[1]\ 作者:Roscchewitz et al.(多机构联合研究)
核心问题
现有医学影像 VLM(视觉-语言模型)将放射科医生 relegate 为"被动观察者"——只能看到最终输出,无法检查推理过程。RadAgent 引入逐步推理轨迹,让每份 CT 报告都附带中间决策和工具调用日志,实现可解释的医学 AI。
技术原理
RadAgent 将胸部 CT 解读从"黑盒输出"转变为显式工具增强的迭代推理:
- 1. 工具调用机制:智能体主动调用图像切片分析、区域测量等工具获取推理依据
- 2. 逐步推理:将报告生成拆解为多个中间步骤,每步产生明确决策
- 3. 完整日志:记录每一步的决策依据、工具调用参数与返回结果
实验结果
| 指标 | 相对提升 |
|---|---|
| 宏观 F1 | +36.4%(+6.0 个点) |
| 微观 F1 | +19.6%(+5.4 个点) |
| 对抗性条件 | +41.9%(+24.7 个点) |
| 忠实度(Faithfulness) | 37.0%(基线为 0%) |
适用人群
- • 放射科医生:可解释推理轨迹辅助诊断,降低对"黑盒 AI"的不信任
- • 医学影像 AI 研究人员:Agent 架构引入 3D 医学影像的分析范式参考
- • 医疗 AI 产品开发者:满足临床"可解释性 + 安全性"强监管需求的合规路径
2. Blue Data Intelligence Layer:流数据与 Agent 驱动的多源多模态应用
论文:arXiv:2604.15233[2]
核心问题
多源多模态数据应用(如工业监控、智慧城市、医疗物联网)面临数据孤岛挑战:流数据处理、多模态融合、Agent 推理三者割裂,缺乏统一框架。
技术原理
Blue Data Intelligence Layer 构建了一个三层架构:
流数据接入层 → 多模态融合引擎 → AI Agent 决策层- • 流数据接入:支持 Kafka、MQTT 等工业协议的统一接入
- • 多模态融合:视觉、时序、文本跨模态对齐
- • Agent 决策:基于融合数据的实时推理与响应
适用场景
- • 工业 IoT 实时监控与异常检测
- • 智慧城市多源数据融合
- • 医疗物联网多模态患者监护
三、每日总结
| 类别 | 项目/论文 | 核心亮点 |
|---|---|---|
| 智能路由 | Manifest | 23维评分算法,2ms内判断复杂度,节省70% API成本 |
| 多Agent协作 | Claude Code Game Studios | 49个AI智能体三层委托,游戏开发完整工作室 |
| 自进化Agent | Evolver | GEP基因组进化协议,提示词变更可审计可复用 |
| 医疗AI Agent | RadAgent | 逐步推理+工具调用,胸部CT报告忠实度达37% |
| 多模态流数据 | Blue Data Intelligence Layer | 工业IoT多模态实时融合与Agent决策 |
本文档由 AI 自动生成,每日 08:30 更新。\ Agent 应用开发商务合作,欢迎邮件联系 yangjie@sourcedreamai.com
引用链接
[1] arXiv:2604.15231: https://arxiv.org/abs/2604.15231
[2] arXiv:2604.15233: https://arxiv.org/abs/2604.15233
夜雨聆风