28 章 AI Agent 全栈课程开源,全部可运行

AI Agent & LLM

早上好，昨天的 AI 圈相当热闹。

重点动态

Bitcoin 交易员靠 Claude 找回丢失 11 年的钱包密码

一个人用 Claude 恢复了价值 40 万美元的比特币钱包，密码丢了 11 年，暴力破解跑了 3.5 万亿次组合都没中。

这位交易员有个 2013 年的旧钱包备份文件，密码早已遗忘。他先用传统暴力破解试了 3.5 万亿次组合，全部失败。转向 Claude 后，通过系统性地分析密码构建模式、缩小候选空间，最终成功解锁。

40 万美元拿回来了。LLM 在模式推理和约束求解上的能力远超传统穷举，这不是算力碾压，是思路碾压。对密码学和逆向工程从业者来说，这个案例值得仔细拆解。

📎 相关链接

Bitcoin trader recovers wallet with help of Claude
https://www.tomshardware.com/tech-industry/cryptocurrency/bitcoin-trader-recovers-usd400-000-using-claude-ai-after-losing-wallet-password-11-years-ago-bot-tried-3-5-trillion-passwords-before-decrypting-an-old-wallet-backup

28 章 AI Agent 全栈课程开源，全部可运行

从 ReAct 循环讲到 Claude Code 逆向，28 章全是可运行 Python 文件，面试导向。

Callous-0923 整理的这套课程覆盖面相当广，MCP/A2A 协议、RAG、DSPy、生产可观测性都有涉及。每章独立可运行，不是从 PPT 翻译的那种教程。

Agent 岗位的面试要求越来越具体，光看过论文不够，得自己写过 ReAct 循环、配过 MCP Server 才有体感。这套材料适合当系统性学习的骨架，也适合查漏补缺。

📎 相关链接

agent-study
https://github.com/Callous-0923/agent-study

逆向 Raycast 2.0，提炼原生桌面 App 设计法则

yetone 逆向了 Raycast Beta.app，提炼出 8 条架构原则和 4 层架构模型，打包成 Agent Skill 发布。

跨平台桌面应用最大的痛点就是"不够原生"。Raycast 在 macOS 上体验出色，很大程度上因为深度绑定了平台特性。yetone 把这些经验抽象成了可复用的设计模式，包含 WebKit/WebView2 兼容指南和 75 项发布审计清单。

做 Electron 或 Tauri 应用的开发者应该看看这份材料。尤其是那个 75 项 ship audit，基本就是一份"为什么你的 app 看着廉价"的完整检查表。

📎 相关链接

native-feel-skill
https://github.com/yetone/native-feel-skill

tokensave：不调用 LLM 的 Token 成本审计工具

10 个类别、31 个子模式的 Token 消耗分类学，静态审计脚本即可给出优化建议，LLM 调用次数为零。

多 Agent 协作系统的成本控制是被严重忽视的问题。一个中等复杂度的 agent 工作流，token 消耗可能比单次 API 调用高两个数量级。tokensave 把成本审计前置到编码阶段，用静态分析替代运行时监控。

审计工具本身不应该成为成本中心，这个选型很聪明。韩语主站加英语镜像的发布方式，也反映了 Agent 工具生态的国际化趋势。

📎 相关链接

tokensave
https://github.com/epoko77-ai/tokensave

OpenData Vector：对象存储上的 MIT 协议向量搜索

跳过专用向量数据库，直接在 S3/R2 等对象存储上做向量搜索，MIT 协议。

RAG 基础设施的运维痛点之一就是向量数据库。OpenData Vector 的思路是在对象存储层直接实现 ANN 搜索，已有大量数据存在 S3 上的团队可以用它显著简化架构。

📎 相关链接

OpenData Vector
https://www.opendata.dev/blog/introducing-vector/

AgentBrain：证据优先的 Agent 运行时

给 Agent 设计了以"证据链"为核心的运行时，每个决策都有可追溯的推理依据。

Agent 系统在生产环境中的可靠性越来越受关注。AgentBrain 要求每个决策都附带证据链，而不是黑盒输出。对于需要审计的金融、医疗等场景，这个范式有实际价值。

📎 相关链接

AgentBrain
https://github.com/rohitg00/agentbrain

Cabeza：长周期 Agent 搜索的可配置推理框架

支持 6 种 Agent 族、5 种上下文管理策略、3 种多 Agent 拓扑，内置 LLM-as-a-judge 评估。

长周期任务是 Agent 的薄弱环节，上下文窗口有限，多步推理容易偏航。Cabeza 把这些变量拆开做成可配置模块，开发者可以针对具体场景组合调参，降低了长周期 Agent 的实验门槛。

📎 相关链接

Cabeza
https://github.com/qhjqhj00/cabeza

MATRIXON：本地小模型驱动的隐私优先浏览器 Agent

用本地 SLM 代替云端大模型做网页自动化，数据完全不出本机。

AI 浏览器 Agent 的核心矛盾是能力与隐私的权衡。MATRIXON 直接在本地跑小模型，牺牲部分能力换取完全的隐私保证。处理网银、内部系统等敏感场景时，这个取舍很合理。

📎 相关链接

MATRIXON Agentic Browser
https://github.com/SAFIYEV/MATRIXON-AGENTIC-BROWSER

面向 Claude Code 和 Codex 的刻意练习 Skill

把"刻意练习"方法论做成 Agent Skill，让 AI 编程助手在开发过程中主动寻找学习机会。

DrCatHicks 的这个 Skill 让 Claude Code 不只是写代码，还会识别代码中的学习点并主动提示开发者。把编程过程变成学习过程，这个思路比单纯提升代码生成效率更有长期价值。

📎 相关链接

learning-opportunities
https://github.com/DrCatHicks/learning-opportunities

下午见。