AI Agent & LLM
早上好,昨天的 AI 圈相当热闹。
重点动态
Bitcoin 交易员靠 Claude 找回丢失 11 年的钱包密码
一个人用 Claude 恢复了价值 40 万美元的比特币钱包,密码丢了 11 年,暴力破解跑了 3.5 万亿次组合都没中。
这位交易员有个 2013 年的旧钱包备份文件,密码早已遗忘。他先用传统暴力破解试了 3.5 万亿次组合,全部失败。转向 Claude 后,通过系统性地分析密码构建模式、缩小候选空间,最终成功解锁。
40 万美元拿回来了。LLM 在模式推理和约束求解上的能力远超传统穷举,这不是算力碾压,是思路碾压。对密码学和逆向工程从业者来说,这个案例值得仔细拆解。

📎 相关链接
Bitcoin trader recovers wallet with help of Claude
https://www.tomshardware.com/tech-industry/cryptocurrency/bitcoin-trader-recovers-usd400-000-using-claude-ai-after-losing-wallet-password-11-years-ago-bot-tried-3-5-trillion-passwords-before-decrypting-an-old-wallet-backup
28 章 AI Agent 全栈课程开源,全部可运行
从 ReAct 循环讲到 Claude Code 逆向,28 章全是可运行 Python 文件,面试导向。
Callous-0923 整理的这套课程覆盖面相当广,MCP/A2A 协议、RAG、DSPy、生产可观测性都有涉及。每章独立可运行,不是从 PPT 翻译的那种教程。
Agent 岗位的面试要求越来越具体,光看过论文不够,得自己写过 ReAct 循环、配过 MCP Server 才有体感。这套材料适合当系统性学习的骨架,也适合查漏补缺。

📎 相关链接
agent-study
https://github.com/Callous-0923/agent-study
逆向 Raycast 2.0,提炼原生桌面 App 设计法则
yetone 逆向了 Raycast Beta.app,提炼出 8 条架构原则和 4 层架构模型,打包成 Agent Skill 发布。
跨平台桌面应用最大的痛点就是"不够原生"。Raycast 在 macOS 上体验出色,很大程度上因为深度绑定了平台特性。yetone 把这些经验抽象成了可复用的设计模式,包含 WebKit/WebView2 兼容指南和 75 项发布审计清单。
做 Electron 或 Tauri 应用的开发者应该看看这份材料。尤其是那个 75 项 ship audit,基本就是一份"为什么你的 app 看着廉价"的完整检查表。

📎 相关链接
native-feel-skill
https://github.com/yetone/native-feel-skill
tokensave:不调用 LLM 的 Token 成本审计工具
10 个类别、31 个子模式的 Token 消耗分类学,静态审计脚本即可给出优化建议,LLM 调用次数为零。
多 Agent 协作系统的成本控制是被严重忽视的问题。一个中等复杂度的 agent 工作流,token 消耗可能比单次 API 调用高两个数量级。tokensave 把成本审计前置到编码阶段,用静态分析替代运行时监控。
审计工具本身不应该成为成本中心,这个选型很聪明。韩语主站加英语镜像的发布方式,也反映了 Agent 工具生态的国际化趋势。

📎 相关链接
tokensave
https://github.com/epoko77-ai/tokensave
OpenData Vector:对象存储上的 MIT 协议向量搜索
跳过专用向量数据库,直接在 S3/R2 等对象存储上做向量搜索,MIT 协议。
RAG 基础设施的运维痛点之一就是向量数据库。OpenData Vector 的思路是在对象存储层直接实现 ANN 搜索,已有大量数据存在 S3 上的团队可以用它显著简化架构。

📎 相关链接
OpenData Vector
https://www.opendata.dev/blog/introducing-vector/
AgentBrain:证据优先的 Agent 运行时
给 Agent 设计了以"证据链"为核心的运行时,每个决策都有可追溯的推理依据。
Agent 系统在生产环境中的可靠性越来越受关注。AgentBrain 要求每个决策都附带证据链,而不是黑盒输出。对于需要审计的金融、医疗等场景,这个范式有实际价值。

📎 相关链接
AgentBrain
https://github.com/rohitg00/agentbrain
Cabeza:长周期 Agent 搜索的可配置推理框架
支持 6 种 Agent 族、5 种上下文管理策略、3 种多 Agent 拓扑,内置 LLM-as-a-judge 评估。
长周期任务是 Agent 的薄弱环节,上下文窗口有限,多步推理容易偏航。Cabeza 把这些变量拆开做成可配置模块,开发者可以针对具体场景组合调参,降低了长周期 Agent 的实验门槛。

📎 相关链接
Cabeza
https://github.com/qhjqhj00/cabeza
MATRIXON:本地小模型驱动的隐私优先浏览器 Agent
用本地 SLM 代替云端大模型做网页自动化,数据完全不出本机。
AI 浏览器 Agent 的核心矛盾是能力与隐私的权衡。MATRIXON 直接在本地跑小模型,牺牲部分能力换取完全的隐私保证。处理网银、内部系统等敏感场景时,这个取舍很合理。

📎 相关链接
MATRIXON Agentic Browser
https://github.com/SAFIYEV/MATRIXON-AGENTIC-BROWSER
面向 Claude Code 和 Codex 的刻意练习 Skill
把"刻意练习"方法论做成 Agent Skill,让 AI 编程助手在开发过程中主动寻找学习机会。
DrCatHicks 的这个 Skill 让 Claude Code 不只是写代码,还会识别代码中的学习点并主动提示开发者。把编程过程变成学习过程,这个思路比单纯提升代码生成效率更有长期价值。

📎 相关链接
learning-opportunities
https://github.com/DrCatHicks/learning-opportunities
下午见。
夜雨聆风