📌 最近一直在聊 AI——和朋友、前辈、同事,也有陌生人。聊得多了发现,还有很大一部分人不知道怎么用 AI,想学却无从下手。所以干脆把自己一路摸索的过程写下来,给同样想上手的朋友做个参考。
🎬 一、接触 AI 的契机
2022 年 11 月,我所在的公司正在打造一款 AI 辅助写作的产品,那时候的我正好是这个产品的 PM。
折腾了一个月后,12 月初的某天早上,我照常和 UI 对接产品细节,聊着聊着就聊到了 ChatGPT。我到现在还清晰地记得我们当时的对话:
UI:你知道这几天发布的一个叫 ChatGPT 的产品吗?
我:听说过,看到一些消息,好像很厉害!
UI:好像也能做到我们这样。
我:你有账号吗?感受一下!
UI:有的,来你看……
于是,我体验到了一个让我「头皮发麻」的产品,并当场认定——我们现在搞的东西就是 「一坨屎」。
回到工位,我果断挂上梯子去注册账号。那时候大陆的手机号还不能注册,我搜了相关教程,花钱买了境外虚拟手机号服务,总算注册成功,也算是比较早一批感受到 AI 大模型魅力的人了。
那会儿我一边自己用,一边给身边的技术同事安利。安利的方式很简单——让 AI 当场写代码给他们看。记得坐在我左手边的是公司前端项目的负责人,他看到之后立马让我帮忙开账号,后面那几天玩得不亦乐乎。
🧭 二、我是如何学习 AI 的
后面我就开始找资料、学 AI 大模型。那时候接触到了一个社区「WayToAGI」,前期相关的知识基本都是在这里补充的。
下面简单概括一下我的学习路径,不做具体讲解,感兴趣的伙伴可以自己打开社区去浏览。
① 了解基本原理
知道了它是基于 Transformer 架构设计出来的 LLM(生成式大语言模型),自然也就理解了什么是「生成式」、什么是「大语言模型」。
② 学习写 Prompt
在不断对话的过程中我发现:想让 AI 的回答符合我的预期,就得把问题描述得足够明确;对回答格式有要求,也必须写清楚,最好还能给出案例来指导。由此我了解到了 Prompt 的概念。于是去「WayToAGI」翻 Prompt 相关的文章和案例,知道了 Markdown 是 AI 更易理解的格式,并开始学着用 Markdown 写出更好的 Prompt。
③ 上下文关联
随着 GPT 迭代,我在使用中发现 AI 好像有了「记忆」——它能记住我前面问过什么,并结合之前的回答给我答案。查资料后才知道,其实是后面的提问携带了上一轮对话的问题和答案。
④ RAG
在知道大模型的核心原理是「预测下一个字的概率 + 文字接龙」之后,我又顺藤摸瓜,搞懂了 token、tokenizer、Temperature、Top-p、Top-k 这些概念,自然也就明白了「AI 幻觉」是怎么回事。顺势又去了解了 RAG(检索增强生成)是什么、有什么作用。
⑤ Agent
RAG 之后,Agent 的概念开始火起来,我也跟风去了解 Agent 是什么。那段时间 DeepSeek 发布了,但春节期间太火爆,根本体验不上,于是我干脆自己拆解了一下图文识别和联网搜索的原理,在 Coze 上通过调用 DeepSeek 的接口,实现了与 DeepSeek 等同的效果。这算是我搭建的第一个 Workflow,后面就在 Coze 上自己创建了不少 Agent 和 Workflow。
⑥ MCP
下一个火热的概念就是 MCP 了。因为那段时间它实在太火,几乎不需要刻意学习,打开社区就能知道这是个什么、能解决什么问题。
⑦ Skill 与 Claude Code
Skill 是继 MCP 之后火起来的概念。相继接触了 MCP 和 Skill 之后,我想真正上手感受一下这两样东西,于是开始使用 Claude Code——这也是我第一次为 AI 付费订阅。
⑧ 上下文工程、Harness Engineering 和 A2A 协议
这些是我在深入使用 Claude Code 的过程中接触到的。这期间我一直关注一个 UP 主「马克的技术工坊」,上面这些概念以及前面提到的,都有详细且通俗易懂的视频讲解。同时我还在抖音上关注了一位深讲技术的大佬,去了解 Agent 开发相关的理论知识。我不懂技术,所以更多是去理解背后的原理。
以上就是我整个学习 AI 的路径,没有具体的解答,只是一条路径。概括下来就是:
接触 LLM、了解核心原理
→ 接触 Prompt 与上下文关联,调用模型接口体验 Prompt 和 Temperature 的作用
→ 知道 AI 没有最新知识、会产生幻觉,了解 RAG
→ DeepSeek 发布,读官方论文了解模型训练(预训练、监督微调 SFT、强化学习 RLHF)和 MoE 架构(混合专家)
→ 用 Coze 搭建 Agent 和 Workflow
→ 学习使用 Claude Code,并把它带入实际工作
🛠 三、如何在日常工作中使用 AI
在学习 Claude Code 的过程中,我开始思考:怎么用它来提升我的工作效率,最好能直接接手我的工作(我就是纯粹想偷懒)。于是我用自己的私人账号,开始把工作内容一点点「AI 化」。
🎨 首先想到的,是让 AI 帮我画原型
我开始向 Claude Code 描述需求,让它生成原型图。呈现方式我想了很多种,最终选择了 HTML——一方面这是 AI 原生支持的方式,另一方面 HTML 自带交互。
但过程中我发现,AI 生成的界面过于单调、美感不足。于是我开始用 Skill,找到一个 UI 设计的 Skill 用起来,效果立马好了不少。
可新的问题又来了:有些小细节需要调整,但每次都通过对话来改会非常消耗 token,不划算。于是我使用 Figma MCP,把 HTML 界面导入 Figma,变成可编辑的 Figma 文件,这样就能很好地解决问题。
其实到后面,当我能把需求描述得越来越清楚时,需要细微调整的情况就越来越少了,再导入 Figma,纯粹是为了方便 UI 同事浏览。
📄 接下来,是制作 PRD
原型这条路被我跑通之后,我甚至能直接用 HTML 做出一个完整的、带交互的功能界面。这样既省去了写交互说明的步骤,又能很直观地讲给同事听。
后面我就想:既然能画原型了,那是不是也能写文档?于是我开始让 AI 写需求文档。试了一次后发现,输出的 Markdown 文件虽然详细,但一长篇读下来可读性很差,又没有原型图搭配,看着确实很累。
于是我又想到——PRD 也不一定非得是文档格式,HTML 同样可以。
我在本子上画出了 PRD 的结构:不能是一个长页面,那样可读性差,所以要有右侧导航;还要有具体的逻辑,这是最重要的;最好再配上产品原型图。
就这样,一个「左中右」结构在我脑子里成型了——左边导航、中间逻辑、右边对应原型图。既然都是 HTML 界面,右侧的原型自然能支持交互,中间的内容也会随着页面切换自动调整。如此,一个完整的 PRD 就搭建完成了。
那怎么让 Claude Code 按照我的要求来做,或者说让它在做 PRD 时就自动套用这套格式呢?答案就是 Skill。于是我借助 Claude Code 自带的 Skill 创建能力,把这个 PRD Skill 给做了出来。
以上只是挑了几个比较有代表性的场景来讲,其实日常工作里还有很多环节,都可以交给 AI 来做。
随着不断深入使用,一个核心问题也自然暴露了出来:我开的是 Pro 账号,token 额度有限,很容易就限额。于是我开始创建 subagent,配合 /compact、/clear等指令来管理上下文,一些需要复用的点就加进 memory 里。
除了工作,一些私人场景我也让 Claude Code 接了进来。比如用 Skill 搭了一个辅助我提升产品技能的助手,帮我系统化地学习;它同时还像一个 mentor,每当我有不理解的问题,它都会用层层引导式的提问,一步步把我带到问题的本质上,对我的回答做分析,记住我的薄弱项,再做针对性的强化训练。
💡 四、写在最后
写了这么多,本质上是想给同样对 AI 感兴趣的朋友和同行一个参考。
很多朋友跟我说,面对现在的 AI 无从下手,不知道怎么学、怎么用到工作和生活里。我的建议是——先用起来。去开一个 Claude Code 或者 Codex 的账号,边用边学。
最好的方式,是把自己日常的工作或生活里的问题,转化成一个 AI 工作流,哪怕这比自己动手还要麻烦。先搭起来,再一步步优化;碰到卡点,就借助上面提到的那些技能去解决,慢慢地就能一点点啃下来。
对于不知道从哪获取知识的朋友,我推荐去看「马克的技术工坊」这个 UP 主的视频,既有相关概念的讲解,也有 Claude Code 的使用技巧,都非常通俗易懂,不需要你懂太多技术。
AI 浪潮之下,希望大家都能保持好奇心,多尝试、多实践、多思考。
如果你有补充的看法、意见或实践案例,欢迎在评论区一起讨论——一起学习,一起进步 👇
夜雨聆风