AI 应用技术串讲与优质文档索引-夜雨聆风

AI 应用技术串讲与优质文档索引

1. LLM (大语言模型) & Transformer 架构

核心要点：

奠基之作： 《Attention Is All You Need》论文确立了 Transformer 架构，奠定了大模型时代的基础。

架构演变：

🟣 Encoder-Only：如 BERT，擅长理解类任务。

🟢 Encoder-Decoder：经典 Seq2Seq 架构。

🔵 Decoder-Only：当前最主流的架构（如 GPT 系列），擅长生成式任务。

参考： [Attention Is All You Need]: https://arxiv.org/abs/1706.03762

2. Prompt Engineering (提示词工程)

核心要点：

定义： 通过设计和优化输入指令（System Prompt + User Prompt），引导模型准确、可控地输出。

特点： 不改变模型参数，是成本最低的“调优”手段。

参考： [Prompt Engineering Notes]: https://www.aneasystone.com/archives/2024/01/prompt-engineering-notes.html

3. Fine-tuning (微调)

核心要点：

定义： 在特定数据集上对预训练模型进行二次训练，使其适应垂直场景。

关键技术：LoRA (Low-Rank Adaptation)，通过仅训练少量低秩参数矩阵，大幅降低训练显存和计算成本。

参考： [LoRA: Low-Rank Adaptation of Large Language Models]: https://arxiv.org/abs/2106.09685

4. RAG (检索增强生成)

核心要点：

机制： 先查后说。先从外部知识库检索相关信息，再将信息注入 Prompt 交给 LLM 生成答案。

价值： 解决模型幻觉问题，提升知识的时效性和准确性。

参考： [Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks]: https://arxiv.org/abs/2005.11401

5. Function Calling (函数调用)

核心要点：

机制： 让 LLM 按照约定 JSON Schema 输出“调用指令”，由外部系统（Host）执行具体操作（如查天气、发邮件）。

意义： 让模型从“只会说话”进化为“会调用工具”。

参考： [OpenAI Function Calling Guide]: https://platform.openai.com/docs/guides/gpt/function-calling

6. MCP (Model Context Protocol)

核心要点：

定义： 模型上下文协议，一种标准化协议。

作用： 让大模型以统一方式连接外部工具、数据源和服务。

生态价值： 实现工具的跨 AI 应用复用，推动社区生态发展。

参考： [Model Context Protocol Docs]: https://modelcontextprotocol.info/docs/introduction/

7. Agent (智能体)

核心要点：

本质： 模拟人类解决问题的闭环流程：思考 (Thought) → 行动 (Action) → 观察 (Observation)。

构成：提示词 + LLM + Tools= 最简 Agent。

设计模式： ReAct, Chain-of-Thought 等。

参考：

• https://medium.com/binome/ai-agent-workflow-design-patterns-an-overview-cf9e1f609696

• https://mp.weixin.qq.com/s/7CZ6cHWQ-T9bmaWoJFwdwA

8. Multi-Agent (多智能体)

核心要点：

机制： 由多个分工协作的 Agent 共同完成复杂任务。

优势： 任务拆分、上下文隔离。

挑战： Token 消耗大、协作效率低、系统复杂度高。

参考： [Building Multi-Agent Systems]: https://claude.com/blog/building-multi-agent-systems-when-and-how-to-use-them

9. Context Engineering (上下文工程)

核心要点：

定义： 管理 Agent 运行所需的一切信息（历史对话、知识、工具结果等）。

目标： 通过筛选、压缩和组织上下文，最大化模型的决策与推理能力。

参考：

•

•

• https://mp.weixin.qq.com/s/KbviOJ6q-K4ik_wzsUs2dw?open_in_browser=true

10. Agent Skill (智能体技能)

核心要点：

定义： 一种轻量级开放格式，用于封装一整套 Agent 能力（Prompt、工具脚本、知识文件）。

本质： 约等于一个“子 Agent”或 SOP（标准作业程序）。

特性： 支持渐进式披露（Progressive Disclosure），按需激活。

参考：

• https://claude.com/blog/equipping-agents-for-the-real-world-with-agent-skills

• https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview

• https://agentskills.io/home

11. OpenClaw / Nanobot

核心要点：

OpenClaw： 开源、高可扩展的 AI Agent 框架（TypeScript），主打构建自定义私人助手，创新点在于扩展了交互入口（如飞书）。

Nanobot： OpenClaw 的精简版/替代实现，代码更易读。

参考：

Nanobot GitHub

12. Harness Engineering (驾驭工程)

核心要点：

定义： 通过构建受控环境，让 Agent 在约束下高效、可靠地完成长周期复杂任务。

实践： 包含约束机制、反馈回路、可靠的上下文管理等。

参考： [OpenAI Harness Engineering]: https://openai.com/zh-Hans-CN/index/harness-engineering/

13. 源码与工具分享

Claude Code 源码分析：

[instructkr/claw-code]https://github.com/instructkr/claw-code

💡 总结

这张图谱清晰地展示了 AI 应用从模型层（LLM）到交互层（Prompt/Agent），再到**工程化层（Context/Harness Engineering）**的完整演进路径。掌握这些概念及其关联，是构建下一代 AI 原生应用的关键。