AI 应用技术串讲与优质文档索引
AI 应用技术串讲与优质文档索引
1. LLM (大语言模型) & Transformer 架构
核心要点:
奠基之作: 《Attention Is All You Need》论文确立了 Transformer 架构,奠定了大模型时代的基础。

架构演变:
🟣 Encoder-Only:如 BERT,擅长理解类任务。
🟢 Encoder-Decoder:经典 Seq2Seq 架构。
🔵 Decoder-Only:当前最主流的架构(如 GPT 系列),擅长生成式任务。
参考: [Attention Is All You Need]: https://arxiv.org/abs/1706.03762
2. Prompt Engineering (提示词工程)
核心要点:
定义: 通过设计和优化输入指令(System Prompt + User Prompt),引导模型准确、可控地输出。
特点: 不改变模型参数,是成本最低的“调优”手段。
参考: [Prompt Engineering Notes]: https://www.aneasystone.com/archives/2024/01/prompt-engineering-notes.html
3. Fine-tuning (微调)
核心要点:
定义: 在特定数据集上对预训练模型进行二次训练,使其适应垂直场景。
关键技术:LoRA (Low-Rank Adaptation),通过仅训练少量低秩参数矩阵,大幅降低训练显存和计算成本。
参考: [LoRA: Low-Rank Adaptation of Large Language Models]: https://arxiv.org/abs/2106.09685
4. RAG (检索增强生成)
核心要点:
机制: 先查后说。先从外部知识库检索相关信息,再将信息注入 Prompt 交给 LLM 生成答案。
价值: 解决模型幻觉问题,提升知识的时效性和准确性。

参考: [Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks]: https://arxiv.org/abs/2005.11401
5. Function Calling (函数调用)
核心要点:
机制: 让 LLM 按照约定 JSON Schema 输出“调用指令”,由外部系统(Host)执行具体操作(如查天气、发邮件)。
意义: 让模型从“只会说话”进化为“会调用工具”。

参考: [OpenAI Function Calling Guide]: https://platform.openai.com/docs/guides/gpt/function-calling
6. MCP (Model Context Protocol)
核心要点:
定义: 模型上下文协议,一种标准化协议。
作用: 让大模型以统一方式连接外部工具、数据源和服务。
生态价值: 实现工具的跨 AI 应用复用,推动社区生态发展。

参考: [Model Context Protocol Docs]: https://modelcontextprotocol.info/docs/introduction/
7. Agent (智能体)
核心要点:
本质: 模拟人类解决问题的闭环流程:思考 (Thought) → 行动 (Action) → 观察 (Observation)。
构成:提示词 + LLM + Tools= 最简 Agent。
设计模式: ReAct, Chain-of-Thought 等。
参考:
• https://medium.com/binome/ai-agent-workflow-design-patterns-an-overview-cf9e1f609696 • https://mp.weixin.qq.com/s/7CZ6cHWQ-T9bmaWoJFwdwA
8. Multi-Agent (多智能体)
核心要点:
机制: 由多个分工协作的 Agent 共同完成复杂任务。
优势: 任务拆分、上下文隔离。
挑战: Token 消耗大、协作效率低、系统复杂度高。
参考: [Building Multi-Agent Systems]: https://claude.com/blog/building-multi-agent-systems-when-and-how-to-use-them
9. Context Engineering (上下文工程)
核心要点:
定义: 管理 Agent 运行所需的一切信息(历史对话、知识、工具结果等)。
目标: 通过筛选、压缩和组织上下文,最大化模型的决策与推理能力。
参考:
10. Agent Skill (智能体技能)
核心要点:
定义: 一种轻量级开放格式,用于封装一整套 Agent 能力(Prompt、工具脚本、知识文件)。
本质: 约等于一个“子 Agent”或 SOP(标准作业程序)。
特性: 支持渐进式披露(Progressive Disclosure),按需激活。
参考:
• https://claude.com/blog/equipping-agents-for-the-real-world-with-agent-skills • https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview • https://agentskills.io/home
11. OpenClaw / Nanobot
核心要点:
OpenClaw: 开源、高可扩展的 AI Agent 框架(TypeScript),主打构建自定义私人助手,创新点在于扩展了交互入口(如飞书)。
Nanobot: OpenClaw 的精简版/替代实现,代码更易读。
参考:
Nanobot GitHub
12. Harness Engineering (驾驭工程)
核心要点:
定义: 通过构建受控环境,让 Agent 在约束下高效、可靠地完成长周期复杂任务。
实践: 包含约束机制、反馈回路、可靠的上下文管理等。
参考: [OpenAI Harness Engineering]: https://openai.com/zh-Hans-CN/index/harness-engineering/
13. 源码与工具分享
Claude Code 源码分析:
[instructkr/claw-code]https://github.com/instructkr/claw-code
💡 总结
这张图谱清晰地展示了 AI 应用从模型层(LLM)到交互层(Prompt/Agent),再到**工程化层(Context/Harness Engineering)**的完整演进路径。掌握这些概念及其关联,是构建下一代 AI 原生应用的关键。
夜雨聆风