AI SKILLS ROADMAP 2026
AI 领域的变化太快了。
ChatGPT、Gemini、Claude 每周都在上新版本,工具一直在换。我自己做博主一年多,每天都在追这些新工具、出教程,但也观察到,对很多想用 AI 把工作做好的朋友来说,这种节奏会让人越来越焦虑。
如果你的目标是把 AI 融入工作、解决实际问题,最好的方式不是追工具,而是掌握底层的 AI 技能。
因为工具、模型会变,但底层逻辑不变。你掌握的是方法,换到任何新工具上都能继续用。
如果你也是这种情况,今天这篇就非常适合你。

咱们从下往上走一遍,最后还有个小测验,看你现在卡在哪一层。
LEVEL 01
基础层:地基
这一层,不管你做什么职业、想用 AI 做什么事,都得有。
三件事,少一件,往上爬都会卡壳。
01
先想清楚你和 AI 的关系,再决定花多少时间
这件事听起来有点虚,但它决定了你接下来所有的选择。
我建议你先给自己定位。简单分一下,大概三种人:
杠杆派:AI 是你的放大器,要全力拥抱。适合做内容、做产品、做生意的人。
协作派:AI 帮你做事,但你的核心价值不能被替代。适合律师、医生、设计师、咨询顾问。
观察派:你的工作 AI 暂时碰不到,但需要知道它在发生什么。适合传统制造业、线下服务业的朋友。
我自己本职做 AI 产品,副业做博主,是典型的杠杆派。每天打开电脑第一件事,就是看 AI 圈出了什么新东西。
但如果你是协作派,你的策略应该是:精挑一两个工具用熟,不用天天追新。
观察派更不用焦虑。你需要的是“关键节点保持感知”,不是上手做。
02
Prompting:把跟 AI 说话的能力打底
AI 用得好不好,真的不是看你用了什么工具,而是看你怎么跟它说话。
但 prompting 不是看两个短视频技巧就能搞定的。“角色扮演”“分步思考”“Few-shot”这些词大家都听过,可真到自己写 prompt 的时候,很多人还是凭感觉。
这件事得系统学。
推荐先刷两门 Google 课程
Design Prompts for Everyday Work Tasks
Start Writing Prompts like a Pro
这两门课最有价值的地方,是把“写 prompt”这件抽象的事,变成了一套有公式的方法。
Google 教的核心框架叫 TCREI:
T Task:任务,你要 AI 做什么,说清楚
C Context:上下文,把背景信息给到
R References:参考,给一两个例子
E Evaluate:评估,结果好不好自己先判断
I Iterate:迭代,不满意就改了再试
举个例子,你想让 AI 帮你写周报。
如果你只说“帮我写一份周报”,出来的东西一定特别官腔,AI 味很重。
但如果你按 TCREI 来写,告诉它:任务是写一份给老板看的周报;上下文是这周做了哪三件事、每件事的产出是什么;参考是上周的周报模板;评估标准是简洁、有数据、有重点、不超过 300 字。
然后看着不满意的地方继续改。出来的东西就完全不一样了。
迭代卡住时,用 RSTI
R:Revisit,回到框架重新审视
S:Separate,把长句子拆成短句
T:Trying,换一种说法或类比任务
I:Introduce,加约束条件
写 prompt 卡住的时候,反复用这四招就够。
如果你想再往进阶走一步,我强烈推荐 Claude 官方最近出的 The Prompting Playbook。这是 Anthropic 工程师 Margot Vanlar 在 Code with Claude 大会上讲的。
这场分享不是“加 please 让 AI 更听话”那种皮毛,而是从一个真实客服 bot prompt 入手,演示怎么在生产环境里把一个出错的 prompt 一点点调好,再迁移到新模型上。
我看完最醒的两个观点:
第一,指令不会增加能力。客服 bot 要算账单 proration,prompt 里再怎么强调“请准确计算”,AI 心算还是会错。正确做法是给它一个计算工具,让模型负责理解需求、调用工具、组装回答,让工具负责实际执行。
第二,好 prompt 要先有 eval。eval 就是测试集。写 5-10 个 test case,覆盖 control case、edge case、capability boundary。改 prompt 前后都跑一遍,不然你根本不知道改得对不对。
03
核心工具栈:挑两套用熟就够
AI 圈每天几十个新发布,追是追不完的。我自己只锁两套组合,每套对应一个场景。
专门用来快速学陌生领域。把论文、视频字幕、博客文章丢进 NotebookLM 做知识源,再用 Gemini 围绕这个知识源问深度问题。
专门用来沉淀和生产。它解决的核心问题是:知识怎么累积。
你每天看那么多文章、视频、播客,看完之后大部分都忘了。下次要用,要么重新搜,要么从零开始问 AI。你看似学了很多,但知识从来没真正变成你的。
这就是 Karpathy 今年 4 月那篇 LLM Wiki 想解决的问题。
传统 RAG 每次回答都要重新翻资料,知识不会累积。LLM Wiki 的思路是:让 AI 提前把你看过的内容整理成一张相互链接的知识网络,每喂一份新资料进去,整个网络都跟着长大。
我自己日常这么用:Obsidian Web Clipper 把好文章、视频字幕一键存进 Obsidian,然后打开 Claude Code 说一句 ingest,它自动建概念页、人物页、事件页,并互相链接好。
最后打开 Obsidian 知识图谱视图,整个领域的脉络一目了然。
这套 wiki 我用了一年多,存了几百份资料。累积到这个量级,威力就出来了。
本地 Agent 最爽的地方是:它不是给你一个标准答案,而是用你一年累积下来的资料,给你一个属于你的答案。
LEVEL 02
中级层:让 AI 真的动手帮你干活
到这一层,AI 不再只是你的对话伙伴,而是你的执行者。
你给它一个总目标,它自己拆步骤、搜资料、跑工具、交付。这种能动手的 AI,叫 AI Agent。
这一层最值得学什么?
用好 local AI agent。
local AI agent 就是跑在你自己电脑上的 Agent。它跟网页上的通用 Agent 最大的区别是:它认识你。
它能读你的文件夹、改你的文档、跟你的工作流打通。一句话,它是给你定制的 AI 助理。
入门我推荐 Anthropic 自家的 Cowork。它是 Claude 桌面端里的一个入口,能在你电脑上自主执行多步任务,不用你一步一步盯着。
学会用 local agent 之后,你能做的事一下子就打开了:
把一小时的访谈,自动提炼成可调用的 Skill。
把笔记和日历整合成每日 digest。
让它跑一个研究课题,输出几万字报告。
这些以前都得是工程师才能搭的工作流,现在你一句话就能让它跑起来。
但 local agent 的技能不止是“会用”。再往上走一层,是你自己用提示词拆 agent:每个角色做什么、谁交接给谁、谁质检,全是你定。
我之前做过一个 9 个 Agent 的深度研究系统,跑“中美机器翻译技术路线对比”这种学术级课题,几轮对话就能拿到一份 2.5 万字的报告,就是这么搭出来的。
提示词的力量,在这一层会被放大十倍。
LEVEL 03
高级层:从用 AI 到造 AI
这一层最核心的技能就一个:vibe coding。
简单说,就是你不写代码,只跟 AI 描述你想要什么,它就能帮你做出来。
像麻省理工的 rui 同学,就是用 vibe coding 把脑子里的知识和奇思妙想一个个表达出来,做出来的东西被很多人喜欢。
重点不是“会不会写代码”
对普通人来说,vibe coding 与其说是一种工具技能,不如说是一种思维方式:你不再纠结“怎么做”,而是先把“想做什么”想清楚,剩下的交给 AI。
举个具体的工作流。
第一步:看到一个特别喜欢的网站,先截图。
第二步:把截图丢给 AI,配上提示词和参考图,让它写一份设计文档。
第三步:跟它讨论细节,把需求逐步理清楚。
第四步:等沟通到满意,再让它帮你写代码。
全程都不需要懂代码。
你现在看到的这个像素风路线图,还有视频里那些小动画,都是我用这套流程 vibe coding 出来的。是不是感觉实现起来也没那么难?
只要你掌握了这种思维,生活和工作里遇到的各种问题,都可以用 vibe coding 解决。
比如下期我想专门做一个:用 HTML 写 PPT。
听起来有点反直觉,对吧?
但现在的 HTML 配上 vibe coding,能做的事比传统 PPT 多得多:能加动画、能加交互、能直接挂到网上分享,效果完全不一样。
vibe coding 带来的真正改变是:你不再被现成工具的功能边界框住。想做什么,就让 AI 帮你直接做出来。
最后,做个小测验
你现在卡在哪一层?
A. 工具栈太杂,还没用熟
B. 想跨到本地 Agent,但不知道怎么开始
C. 已经在 Level 3,开始折腾自己的 Agent 了
评论区告诉我:你现在卡在哪一层?
是工具栈太杂没精通?还是想跨到本地 Agent 不知道怎么开始?还是已经在 Level 3 折腾自己的 Agent 了?
我看到都会回。
关注达姐
带你第一视角玩转前沿科技
夜雨聆风