乐于分享
好东西不私藏

AI 应用技术串讲与优质文档索引

AI 应用技术串讲与优质文档索引

AI 应用技术串讲与优质文档索引

1. LLM (大语言模型) & Transformer 架构

核心要点:

奠基之作: 《Attention Is All You Need》论文确立了 Transformer 架构,奠定了大模型时代的基础。

架构演变:

🟣 Encoder-Only:如 BERT,擅长理解类任务。

🟢 Encoder-Decoder:经典 Seq2Seq 架构。

🔵 Decoder-Only当前最主流的架构(如 GPT 系列),擅长生成式任务。

参考: [Attention Is All You Need]: https://arxiv.org/abs/1706.03762


2. Prompt Engineering (提示词工程)

核心要点:

定义: 通过设计和优化输入指令(System Prompt + User Prompt),引导模型准确、可控地输出。

特点: 不改变模型参数,是成本最低的“调优”手段。

参考: [Prompt Engineering Notes]: https://www.aneasystone.com/archives/2024/01/prompt-engineering-notes.html


3. Fine-tuning (微调)

核心要点:

定义: 在特定数据集上对预训练模型进行二次训练,使其适应垂直场景。

关键技术:LoRA (Low-Rank Adaptation),通过仅训练少量低秩参数矩阵,大幅降低训练显存和计算成本。

参考: [LoRA: Low-Rank Adaptation of Large Language Models]: https://arxiv.org/abs/2106.09685


4. RAG (检索增强生成)

核心要点:

机制: 先查后说。先从外部知识库检索相关信息,再将信息注入 Prompt 交给 LLM 生成答案。

价值: 解决模型幻觉问题,提升知识的时效性和准确性。

参考: [Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks]: https://arxiv.org/abs/2005.11401


5. Function Calling (函数调用)

核心要点:

机制: 让 LLM 按照约定 JSON Schema 输出“调用指令”,由外部系统(Host)执行具体操作(如查天气、发邮件)。

意义: 让模型从“只会说话”进化为“会调用工具”。

参考: [OpenAI Function Calling Guide]: https://platform.openai.com/docs/guides/gpt/function-calling


6. MCP (Model Context Protocol)

核心要点:

定义: 模型上下文协议,一种标准化协议。

作用: 让大模型以统一方式连接外部工具、数据源和服务。

生态价值: 实现工具的跨 AI 应用复用,推动社区生态发展。

参考: [Model Context Protocol Docs]: https://modelcontextprotocol.info/docs/introduction/


7. Agent (智能体)

核心要点:

本质: 模拟人类解决问题的闭环流程:思考 (Thought) → 行动 (Action) → 观察 (Observation)

构成:提示词 + LLM + Tools= 最简 Agent。

设计模式: ReAct, Chain-of-Thought 等。

参考:


8. Multi-Agent (多智能体)

核心要点:

机制: 由多个分工协作的 Agent 共同完成复杂任务。

优势: 任务拆分、上下文隔离。

挑战: Token 消耗大、协作效率低、系统复杂度高。

参考: [Building Multi-Agent Systems]: https://claude.com/blog/building-multi-agent-systems-when-and-how-to-use-them


9. Context Engineering (上下文工程)

核心要点:

定义: 管理 Agent 运行所需的一切信息(历史对话、知识、工具结果等)。

目标: 通过筛选、压缩和组织上下文,最大化模型的决策与推理能力。

参考:


10. Agent Skill (智能体技能)

核心要点:

定义: 一种轻量级开放格式,用于封装一整套 Agent 能力(Prompt、工具脚本、知识文件)。

本质: 约等于一个“子 Agent”或 SOP(标准作业程序)。

特性: 支持渐进式披露(Progressive Disclosure),按需激活。

参考:

  • • https://claude.com/blog/equipping-agents-for-the-real-world-with-agent-skills
  • • https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview
  • • https://agentskills.io/home

11. OpenClaw / Nanobot

核心要点:

OpenClaw: 开源、高可扩展的 AI Agent 框架(TypeScript),主打构建自定义私人助手,创新点在于扩展了交互入口(如飞书)。

Nanobot: OpenClaw 的精简版/替代实现,代码更易读。

参考:

Nanobot GitHub


12. Harness Engineering (驾驭工程)

核心要点:

定义: 通过构建受控环境,让 Agent 在约束下高效、可靠地完成长周期复杂任务。

实践: 包含约束机制、反馈回路、可靠的上下文管理等。

参考: [OpenAI Harness Engineering]: https://openai.com/zh-Hans-CN/index/harness-engineering/


13. 源码与工具分享

Claude Code 源码分析:

[instructkr/claw-code]https://github.com/instructkr/claw-code


💡 总结

这张图谱清晰地展示了 AI 应用从模型层(LLM)交互层(Prompt/Agent),再到**工程化层(Context/Harness Engineering)**的完整演进路径。掌握这些概念及其关联,是构建下一代 AI 原生应用的关键。