过去一年,AI 时时刻刻都在冒出新的概念。
一开始是 Prompt、CoT 这些偏“怎么用模型”的东西;
后来是 LLM、RAG、Multi-Agent,开始往“能力更强、系统更复杂”走;
再到 Deep Research、Agentic AI,本质是在说“让 AI 多做几步”;
最近这一波是 Harness、Claw、Hermes,已经进入“怎么把这一整套东西工程化、产品化、再重新命名一遍”的阶段。
我把所有新词输入给AI,让它给我总结个表:
输入控制层 → 模型能力层 → 知识增强层 → 搜索推理层→ 执行代理层 → 工程控制层 → 文化/叙事层/新命名层
分类 | 词 | 解释 |
输入控制 怎么把话说给模型听 | Prompt | 给模型的输入指令,最基础的交互单位。 |
System Prompt | 比普通 prompt 更上层的系统级规则,用来约束模型的角色、风格和边界。 | |
PE / Prompt Engineering | 对提示词进行设计、修改和优化,让输出更稳定、更接近目标。 | |
CoT / Chain-of-Thought | 一种提示方法,让模型按步骤进行中间推理,适合复杂、多步任务 | |
模型能力模型本身是什么、强到什么程度 | Token | 模型处理文本时的基本计量单位,用于计算输入输出长度和成本。 |
LLM | Large Language Model,大语言模型,当前大多数文本生成 AI 的基础形态。 | |
Foundation Model | 更泛化的基础模型概念,强调可被适配到多种任务,而不止语言。 | |
Context Window | 模型一次能处理的上下文长度。上下文越长,理论上能看更多材料。 | |
多模态 | 模型能处理不止文本,还包括图像、音频、视频等多种模态。 | |
深度学习 | 现代大模型背后的更底层技术范式,基于多层神经网络。这个词比生成式 AI 更早。 | |
AGI | Artificial General Intelligence,通用人工智能,通常指广泛达到或接近人类通用能力的 AI 愿景,更多是终局叙事,不是当前产品能力名。 | |
知识增强与连接 模型自己不知道,就去接知识、工具和数据 | RAG | Retrieval-Augmented Generation,先检索外部资料,再基于资料生成答案。 |
Hybrid RAG | 混合多种检索方式的 RAG,比如关键词检索 + 向量检索。 | |
Agentic RAG | 把检索过程交给 agent 动态规划,不是只搜一次,而是按任务多轮检索、筛选和整合。 | |
MCP | Model Context Protocol,用于把模型接到外部数据源、工具和系统上的协议层。OpenAI 的文档把它用于 chat、deep research、company knowledge 等场景。 | |
搜索 + 推理 一边搜,一边想,一边整理 | Deep Research | OpenAI 官方定义为一种能自主查找、分析、综合大量来源并完成多步骤研究任务的模型/agent 能力。 |
Deep Reasoning | 更强调复杂推理能力的说法,通常指模型会花更多步骤或算力做更复杂的问题求解。 | |
边搜边想 | 中文产品话术,本质上就是 search + reasoning 的组合。 | |
自动搜索 | 模型自己判断要不要联网搜索 | |
执行代理让 AI 不只是回答,而是开始做事 | Agent | 能自主完成任务、调用工具、执行动作的 AI 系统。IBM 的定义里,agent 是能代表用户或系统自主执行任务的程序。 |
Agentic AI | 比“agent”更强调目标导向、自主规划和少量监督的说法。通常是更强叙事版的 agent。 | |
Multi-Agent | 多个 agent 分工协作完成任务,比如一个负责计划、一个负责执行、一个负责校验。 | |
AI Copilot | 以“副驾驶”方式辅助用户工作的 AI 助手。微软官方定义里,copilot 是 conversational, AI-powered assistant。 | |
AI Native | 指产品或组织从底层就按 AI 来设计,而不是后加一个 AI 功能。这个词更偏产品/公司叙事。 | |
工程控制别让 agent 乱跑,要能控、能验、能调度 | Harness | 包在 agent 外面的一层控制系统,用来连接工具、环境、约束和反馈。 |
Guardrails | 护栏。指对模型或 agent 的安全边界、规则限制和行为约束。 | |
Harness Engineering | Martin Fowler 近期用这个词来描述围绕 coding agents 的工程实践:通过外部结构和验证机制,让 agent 更可控、更可信。 | |
文化 / 工作方式类/新命名生态 agent 进一步产品化之后,怎么包装成新的系统、生态和“技能市场” | Vibe Coding | 一种“凭感觉让 AI 往前写”的编程方式。Martin Fowler把它描述为:几乎不关注代码本身,只让 LLM 一路生成。 |
Vibe Design | vibe coding 在设计领域的迁移说法,指凭感觉用 AI 生成和拼接设计方案。 | |
Vibe XXX | vibe 系列的泛化用法,任何“低门槛、凭感觉、快速让 AI 先做出来”的工作方式,都可能被套成 vibe + 行业名 | |
小龙虾 | 中文语境里对 claw/lobster 这一挂命名的戏称。不是严格术语,更像圈内简称。 | |
OpenClaw | 一个运行在个人设备上的开源个人 AI assistant / agent 系统,可接消息渠道、本地设备和工具。 | |
QClaw | Claw 路线的变体命名,通常可理解为某种 OpenClaw 派生版本。 | |
Local Claw | 强调本地部署、本地模型或本地执行环境的 Claw 系统。OpenClaw 官方文档也专门讨论了 local models。 | |
Skill | agent 的可复用能力单元。GitHub Docs 把 agent skills 定义为 instructions、scripts、resources 的组合,供 agent 按需加载。 | |
SkillHub | 技能仓库 / 注册中心。iflytek 的 SkillHub 把自己定义为 open-source agent skill registry。 | |
WorkBuddy | 一类桌面工作代理产品名。腾讯官方站点把 WorkBuddy 定义为“AI 原生的桌面智能体工作台”,并强调兼容 OpenClaw skills。 | |
Hermes | Nous Research 的 self-improving AI agent,强调 built-in learning loop、skills、memory 和跨 session 持续积累。 |
最开始会觉得兴奋,很积极,第一时间看教学找源头信息,下载尝鲜,生怕晚一步。
到逐步学不动了,甚至很多概念还没学会,就被淘汰了...
慢慢变得焦虑、疲惫,甚至开始出现生理性厌恶...
技术当然是在进步的。
但问题在于:
这些变化,在用户侧到底有没有真实的使用场景?
其实并不需要AI给我写代码做网站,虽然无礼,但这世上无用的垃圾APP已经很多了...
也没有用AI做PPT的需求,毕竟一年最多也就做个一两次 PPT,本来就是个包装行为...
更不需要AI来帮我点外卖、买衣服、订机票,用户习惯的迁移是有巨大的成本的,体验并没有带来质的变化...
最后,我内心本质排斥 24小时帮我收集信息、自动执行任务的小助手;
Big No No,人是需要休息的,为什么要鼓励一个“永远在线、永远在做事”的生活方式?
很多所谓的“新能力”,在不断放大一件事:
让人更高频、更持续地工作,所以很多人都能明显的感受到,为什么AI提效后,却越来越累了...

另一方面,我现在生活实实在在离不开AI,GPT高频深度使用用户:

很多问题都会直接问AI,除了工作以外,感情、生活也会愿意和AI聊一聊,这一年AI已经深入到我方方面面的生活中,但我对它的期待和需求始终只有两个:
降低幻觉+增加记忆
第一 降低幻觉
我希望它给我的信息是最新的、靠谱的,是可以被信任的,而不是听起来很对但其实是编出来的;或者是被一些刻意的有毒的信息投喂过的结果。
这本质上是一个信任问题,而不是能力问题。
AI最开始的作用是能汇总和检索到更好的内容,不是消灭人的创作,很难想象有一天,所有的信息都是 AI检索AI生成的信息和图,甚至AI自己交流自己工作,简直是个现实中最大的恐怖故事。
第二 增加记忆
不是那种刻意营造出来的“人格感”,每句话都要记住一个设定并打出来,比如你是XXX,所以你XXX,听起来就很傻 X;
仅仅是很基础的,能自然的记住我的偏好、我的习惯、我说过的话,谨慎的让对话有连续感和继承性,不必每次重新开始。
在这个前提下,再看当前大部分 AI 产品的方向,其实是有偏差的。
行业不断在强调和炫技:
更复杂的 Agent
更自动化的流程
更全面的能力覆盖
相对应的,产品本身在不断叠加:
模式(模型/搜索 / 思考 / 研究 / agent)
能力入口(原力/任务/工具 / 插件 / workflow)
概念(agentic / deep / claw / skill)
但对用户来说,这些不是“能力”,
而是:额外的理解成本
还记得安装小龙虾那波,风风火火的排队,现在还有多少人真的在用呢?
不可否认,所有的能力都一定能找到场景和诉求,但是到底是不是AI发展真正的核心和主线?
太多的行业噪音让人疲惫不堪,越来越脱敏...

夜雨聆风