黄仁勋把 AI PC 又推到了台前。
这件事表面看,是硬件和算力的升级:未来的电脑不只是打开网页、写文档、跑软件,而是可以在本地运行模型、调用工具、承载 Agent,变成每个人桌面上的 AI 工作站。
但我觉得它真正值得普通人关注的,不是“AI PC 到底有多强”,而是另一个更具体的问题:
当每个人都有一台能跑 Agent 的电脑时,你准备好让 Agent 进入自己的工作了吗?硬件会越来越强,模型会越来越便宜,Agent 会越来越常见。
可是,如果你的项目没有入口,资料没有索引,任务没有状态,产物没有验收,经验没有沉淀,那么 AI PC 再强,也只是一个更快的聊天窗口。
所以这篇文章不想只聊 AI PC 本身。
我更想聊 AI PC 背后真正会改变个人工作的东西:
个人 Agent 工作台。
过去很长一段时间,我们谈 AI,最常谈的是提示词。
怎么问,怎么描述背景,怎么让 AI 按格式输出,怎么让它像专家一样回答。
这些当然重要。可是当我真的把 Codex、Claude Code 和一套本地项目管理系统放进日常工作里,用它们连续处理产品原型、AI 洞察、交易复盘、飞书文档、每日总结、项目沉淀之后,我越来越确定一件事:
AI PC 解决的是 Agent 跑在哪里;个人 Agent 工作台解决的是 Agent 怎么真正参与工作。
如果你不想读完整篇,也可以直接把这篇文章丢给 AI,让它先帮你做一次“个人工作系统诊断”。不要只让它总结观点,可以直接复制这段提示词:
请你不要只总结这篇文章,而是基于文章的方法论,帮我诊断我当前的 AI 使用方式。请按下面结构输出:1. 这篇文章的核心观点,用 3 句话说明。2. 我现在可能还停留在哪个阶段:聊天式使用、任务式使用、项目式使用,还是 Agent 工作台式使用。3. 如果我要搭建自己的个人 Agent 工作台,最应该先补哪 5 个文件或机制。4. 请给我一个最小可执行版本,让我今天就能开始,不要给复杂方案。5. 请指出我最容易踩的 3 个坑,以及对应的避免方法。6. 最后,请根据我的工作类型,给我设计一个适合我的“项目大脑”目录结构。这篇文章真正想解决的不是“你知不知道 AI PC”,而是:你能不能从今天开始,让 AI 进入你的真实工作现场。
提示词解决的是:
这一次怎么说清楚?但真实工作里更大的问题是:
下次能不能不用重新说?这就是我这段时间最大的变化,也正是 AI PC 时代真正需要补上的一块。
我不再只是“使用 AI”,而是在搭一个 AI 可以持续进入的工作环境。我把它叫作:个人 Agent 工作台。
一、从聊天窗口,到工作现场
以前我和 AI 的关系更像问答:
我有问题 -> 问 AI -> AI 回答 -> 我自己消化 -> 我自己推进这种方式适合单次任务,比如写一段文案、总结一篇文章、生成一个方案。
但它不适合长期项目。
长期项目的问题是:上下文会越来越多,状态会不断变化,文件会反复修改,之前的判断会被推翻,新的事实源会出现。如果每一次都靠聊天窗口重新解释,AI 再聪明,也会像一个每天重新入职的新人。
所以我的工作方式开始变成:
我有项目 -> 建项目大脑 -> Agent 读取上下文 -> 执行任务 -> 回写状态 -> 下次继续接力这一步很关键。
AI 不再只是回答问题的对象,而开始变成一个可以被组织、被约束、被交接的工作主体。
二、真正的问题不是 AI 会不会,而是它在哪工作
很多人会问:哪个模型更强?Claude 好还是 GPT 好?Codex 好还是 Claude Code 好?
这些问题有价值,但不是最底层的问题。
AI PC 出现之后,这个问题会变得更明显。
因为过去很多人还可以把问题归因于“模型不够强”“本地算力不够”“工具不够方便”。但当本地电脑就能运行越来越强的 AI,当 Agent 可以直接在你的桌面、文件夹、浏览器和项目里工作时,真正的短板会暴露出来:
不是 AI 没能力。而是我们没有给 AI 一个可工作的现场。真正重要的是:
AI 在什么环境里工作?它能看到什么?它不能碰什么?什么是事实源?什么情况必须问人?做完后怎么验收?下次怎么接上?一个没有工作环境的 AI,再强也只能临时回答。
一个有工作环境的 AI,才可能持续协作。
这也是我理解 AI PC 的关键:它不是简单把云端模型搬到本地,而是把 Agent 带到了个人工作的第一现场。
但现场不是自动存在的。
现场需要被设计。
我现在越来越把 Agent 看作一个数字工作者。一个人类员工加入项目时,你不会只给他一句提示词。你会给他项目背景、资料位置、权限边界、验收标准、交付格式和下一步任务。
Agent 也一样。
三、个人 Agent 工作台是什么
我对个人 Agent 工作台的定义是:
一个让 AI 能够进入真实项目现场,读取上下文、执行任务、留下证据、回写状态、形成接力的个人工作系统。它不是一个软件,也不是一个单独工具。
它更像一种工作组织方式。
如果说 AI PC 是新一代个人计算设备,那么个人 Agent 工作台就是这台设备上的工作操作系统。
AI PC 给你算力、模型和端侧能力。
Agent 工作台给 Agent 提供任务环境、事实源、边界、流程和验收。
前者决定“能不能跑”,后者决定“能不能干成事”。
在我的实践里,它至少有七层:
项目大脑外部工作台工作流契约记忆系统验收系统失败评测收工同步这七层合在一起,才让 AI 从“聊天工具”变成“项目协作者”。
四、项目大脑:让 AI 不再从零开始
我现在会给重要项目建立一个项目大脑。
它不是普通文件夹,而是 AI 可以读懂的项目入口。
一个项目大脑通常包括:
README.md 项目说明mission_interface.md 项目目标和边界state_snapshot.md 当前状态source_index.md 事实源地图agent_workflows/ 可重复工作流workflow_evals/ 失败案例和评估规则runs/ 每次重要运行记录episodes/ 可复用经验reviews/next_actions.md 跨日接力这套结构的价值在于:AI 下次进来时,不需要重新问“这个项目是什么”。
它可以先读项目状态,知道现在做到哪,事实源在哪里,哪些东西已经过期,下一步该做什么。
这不是为了把文件夹整理得漂亮,而是为了降低上下文重建成本。
五、工作流契约:不是让 AI 自由发挥,而是让它按岗位工作
当一个任务重复出现,就不能每次靠临时提示词。
比如我有这些高频任务:
• 每日工作总结 • AI 洞察提炼 • 产品原型生成 • 同心圆事件分析复盘 • 飞书文档创建 • 老师消息同步 • 项目收工同步
这些任务都应该变成工作流契约。
一个工作流契约要写清楚:
什么时候触发要读哪些事实源可以写哪些文件哪些动作必须问人哪些动作绝对不能做完成证据是什么失败后怎么回滚我尤其重视两件事:
第一,Forbidden Actions。
也就是 Agent 绝对不能自动做什么。
第二,Brain / Hands Boundary。
也就是 Agent 可以思考什么,但不能随便动手做什么。
比如在交易分析里,AI 可以分析主线、比较股票、做复盘,但不能把“值得观察”直接写成“可以买”。
这就是工作流契约的意义:让 AI 不只是能干活,还知道边界。
六、记忆不是存储,而是恢复工作现场
很多人说 AI 要有记忆。但我觉得“记忆”这个词经常被误解。
真正有用的记忆,不是把所有东西都存下来。
真正有用的记忆,是为了让下次能恢复工作现场。
在我的系统里,记忆分成几类:
state_snapshot:当前状态source_index:事实源地图runs:这次做了什么episodes:可复用经验scratch_logs:长任务过程trend_memory:长期趋势判断next_actions:下次接力每一类记忆都有不同作用。
state_snapshot 让 AI 知道当前状态。
source_index 让 AI 知道该相信哪些文件。
runs 让 AI 知道这次到底做了什么。
episodes 让 AI 下次遇到类似任务时能复用经验。
next_actions 让第二天可以直接接上。
所以我现在对记忆的理解是:
记忆不是资料堆积,而是上下文重建能力。
七、验收系统:AI 说完成,不代表真的完成
AI 很容易给人一种“完成了”的感觉。
文章结构完整,它会说完成了。
原型页面能打开,它会说完成了。
报告有表格,它会说完成了。
但真正的问题是:
有没有读最新事实源?有没有逐条覆盖用户目标?有没有产物路径?有没有验证证据?有没有说明剩余风险?有没有回写状态?我们后来专门沉淀了一个失败类型:ready-confidence-failure。
它指的是:AI 因为输出看起来完整,就提前宣称 ready,但关键验证没有做。
所以我现在要求重要任务必须有 ready gate:
目标覆盖事实源可追溯产物有路径验证可说明风险已标注状态已回写没有这些,就只能叫草案,不能叫完成。
八、失败案例,才是 Agent 系统真正变强的地方
我以前也会把失败当成一次提醒:下次注意。
但后来发现,只说下次注意没有用。
真正有用的是把失败写成评测样本。
我们现在沉淀了几类真实失败:
source-freshness-failure:把旧信息当最新ready-confidence-failure:没验证就说完成observation-as-action:把观察误写成行动overlong-next-actions:明日接力写太长每一个失败样本都要写清:
触发场景失败模式为什么重要如何检测如何恢复下次如何预防这样失败才会变成系统能力。
比如“明日接力写太长”这个问题,听起来很小,但它会让第二天根本不知道先做什么。后来我们就规定:
next_actions 最多 3 条。每条必须有明确动作、对象和完成信号。这就是失败变成规则。
九、Codex 和 Claude Code 的分工
我现在主要用 Codex 和 Claude Code。
它们各有适合的位置。
Codex 更适合:
本地项目系统代码和脚本文件结构维护自动化runs / episodes / next_actions持续工作流执行Claude Code 更适合:
长文本创作概念展开文档生成飞书/白板/原型创意项目内容打磨但真正关键的不是哪个工具更强,而是:
两个 Agent 都要回到同一个项目工作台。如果 Codex 做一套,Claude Code 做一套,最后没有统一沉淀,工作还是会散。
这点放在 AI PC 时代更重要。
未来你的电脑里可能不止一个 Agent:有写代码的,有整理资料的,有做内容的,有管日程的,有做数据分析的。
如果每个 Agent 都在自己的聊天窗口里工作,那么 AI PC 只会让碎片化更严重。
真正有效的方式,是让不同 Agent 共享同一个项目工作台:
同一套项目入口同一套事实源同一套状态文件同一套验收标准同一套沉淀机制这样,AI PC 才不是多了几个智能应用,而是真的长出了一个可接力的个人工作系统。
所以我每天总结工作时,会专门确认:Codex 做了什么,Claude 做了什么,它们有没有同步到每日工作和项目沉淀。
这一步看似麻烦,其实是让多个 Agent 共享同一个长期记忆。
十、2个真实案例
1. 每日工作系统
每日工作最早只是记录今天做了什么。
后来它变成了一个跨天接力系统:
今日待办今日过程记录今日思考今日产物明日接力今日收尾再后来加入了人-Agent 协作复盘、思维薄弱点、协作卡点、可沉淀提示词、run 和 episode。
它的价值不是写日记,而是让第二天能接上。
2. AI 洞察系统
AI 洞察不是资讯收藏。
它要变成趋势记忆。
我会记录一个判断出现了几次,证据是在增强还是减弱,它应该如何升级我的工作系统。
比如“Agent 从模型能力竞争转向工作系统能力”这个判断,就推动我升级了 workflow、eval、budget、权限边界和上岗制度。
好的 AI 洞察,不是让你知道更多,而是让你的系统变得更好。
十一、普通人怎么开始
如果你也想搭一个个人 Agent 工作台,不需要一开始做得很复杂。
最小版本只需要 7 个东西:
一个项目目录一个 README一个 state_snapshot一个 source_index一个 next_actions一个 runs 文件夹一个 workflow然后坚持一个闭环:
读状态 -> 做任务 -> 留产物 -> 验证 -> 写 run -> 更新 next action只要这个闭环跑起来,你就已经不只是“会用 AI”,而是在“组织 AI 工作”。
十二、未来真正稀缺的能力
我越来越相信,AI 能力会越来越便宜。
模型会更强,工具会更多,生成内容会越来越容易。
AI PC 的普及会进一步加速这件事。
当算力下沉到个人设备,当 Agent 可以在本地持续运行,AI 能力会从“稀缺资源”变成“基础设施”。
到那时,真正拉开差距的不会是“谁买了更强的电脑”,而是“谁能把 AI 组织进真实工作流”。
但真实工作里的问题不会消失:
事实源混乱权限边界不清历史状态过期任务范围漂移完成缺少证据接力没人维护失败没有沉淀这些问题不是靠更好的模型自动解决的。
它们需要工作系统。
所以未来真正稀缺的能力,不只是会不会用 AI,而是:
能不能为 AI 设计一个可靠的工作环境。这就是我说的:从会用 AI,到会组织 AI。
AI PC 是硬件入口。
Agent 工作台是能力入口。
真正的变化,不是电脑里多了一个 AI 按钮,而是每个人都开始拥有一套可以让 AI 持续工作的个人生产系统。
结尾
最后用几句话总结:
AI PC 解决的是 Agent 跑在哪里,Agent 工作台解决的是 Agent 怎么干成事。
AI 不是从聊天窗口里变强的,而是从工作环境里变强的。
提示词时代解决的是表达问题,Agent 工作台时代解决的是协作问题。
真正的 Agent 能力,不是模型会多少,而是它能不能进入一个项目现场,读懂状态,执行边界,留下证据,完成接力。
未来的竞争不是谁问 AI 问得更好,而是谁更会设计 AI 可以持续工作的环境。
这就是我的个人 Agent 工作台方法论。
夜雨聆风