
说一个真实的场景。
上周三我花了一个下午整理自己的 AI 工具栈。结果发现——我现在用 8 个工具,就能完成过去需要 5 个人干的活。
不是夸张。是真的。
GitHub 的 Spec Kit 解决了一个根本问题:AI 生成的代码质量不可控。
它的工作方式是"规范驱动"。先写规范(规格文档),再让 AI 根据规范写代码,最后验证代码是否符合规范。
就像建筑施工——不是让工人"看着建",而是先有图纸、有标准、有验收流程。
我的用法:写 API 时先写 Spec ,然后让 Claude Code 或 Codex 根据 Spec 生成代码框架,最后用 Spec Kit 验证。
效率提升?至少 40%。
OpenRouter 新出了个 Advisor 功能。
核心逻辑是:小模型遇到搞不定的问题,自动"咨询"一个更高级的顾问模型,然后回到小模型继续执行。
相当于你的实习生不会的时候,先问老板,然后实习生把答案整理好交给你。
最妙的是——你不需要自己写这个逻辑。 OpenRouter 内置了 Advisor 模式。一行配置。
这个工具我前文提过,但在这里单独列出来是因为它值得。
Hivemind 收集团队中所有编程智能体的运行轨迹,转化为可复用技能。一个 Agent 犯的错误,所有 Agent 都学到。
Claude Code 在 Hivemind 下准确率提升 19.1 分, Codex 提升 24.8 分。
安装方式:一行命令。数据存在你自己的云存储。
Perplexity 的 Personal Computer 是一个 Windows 桌面应用。
它能做什么?操作你的文件管理器、管理你的应用窗口、自动化重复性工作流。
不是"在浏览器里帮你搜东西",而是真正住进你的操作系统里。
对我来说最大的价值是:它把我从"切换工具 → 操作工具 → 切换回对话"的痛苦循环中解放出来了。
OpenAI 的 Dreaming V3 有一个功能让我很在意——它会"做梦"。
后台自动处理你过去的对话,提取你的偏好、习惯、决策模式,然后在新对话里用起来。
这意味着什么?意味着你不需要每次都重新说明自己的需求。它记住了。
当然也有隐私顾虑——它记得你的一切。但如果你信任 OpenAI ,这个功能确实好用。
斯坦福开源的 OpenJarvas 是一个本地化 AI 助手框架。
跟 ChatGPT 的区别是:数据不离开你的设备。
本地模型做推理,本地设备做感知。你的语音、图像、位置数据,全部本地处理。
适合对隐私有高要求的场景。比如医疗、法律、金融。
Qwen2.5-3B 是一个很小的模型。 30 亿参数,手机端都能跑。
但它被用来构建了一个虚拟经济体——五个 Qwen 2.5-3B 模型在模拟的森林里生产、交换、消费,涌现出了通货膨胀、资源管理、甚至市场崩盘。
这说明什么?小模型不是"差的大模型",是"不同用途的专用模型"。
我用 Qwen 2.5-3B 做的是——本地快速推理。不依赖网络,不花 API 费用,响应速度极快。
Hugging Face 发布了 Persona Atlas 。
它做什么?用向量空间给人类画性格地图。把你的行为数据映射到多维度的人格空间中。
听起来很玄?其实很简单——它通过分析你的写作风格、决策模式、社交行为,给你画一张"你是什么样的人"的地图。
对我最有用的是——它帮我理解了自己在不同场景下的行为模式。有时候我自己都不知道为什么做了某个决定。

这 8 个工具,覆盖了五个维度:

这八样组合起来,就是一个完整的人类-AI 协作系统。

不是"AI 替代人",也不是"人控制 AI"。
是人和 AI 一起成长。
🦞
夜雨聆风