
一、基础模型层(大脑)
通用闭源基座模型
GPT-4o / GPT-5
特点:多模态统一架构,工具调用强,长文本稳定,逻辑严谨
优势:综合能力天花板,生态最完善
场景:企业级Agent、复杂推理、高可靠性业务
Claude 3.5 Opus / Sonnet
特点:超长上下文,合规性强,输出稳定,幻觉低
优势:文档处理、法律金融、长文本分析无敌
场景:私有化审阅、知识库问答、合规内容生成
Gemini Advanced 2.5
特点:原生多模态,视频理解强,代码与数学均衡
优势:多模态实时交互,谷歌生态打通
场景:视觉Agent、机器人决策、实时分析
DeepSeek-R1 / V3
特点:推理强,代码优秀,性价比高
优势:国产闭源顶流,API稳定便宜
场景:国内企业API调用、低成本Agent
通用开源基座模型
Llama 4
特点:MoE架构,多模态,开源商用友好
优势:国际主流开源底座,生态最成熟
场景:企业私有化部署、二次微调
Qwen 3 / Qwen-VL
特点:中文强,多模态均衡,端云一体
优势:国产开源顶流,工具调用对齐OpenAI
场景:中文Agent、本地部署、智能硬件
GLM-6
特点:对话流畅,长文本,工具调用成熟
优势:学术+商用双生态,国内落地案例多
场景:教育、客服、办公助手
Mistral Large 3
特点:小参数高性能,推理速度快
优势:轻量高效,适合端侧与边缘设备
场景:移动端AI、低算力环境
代码专用模型
Codex
特点:代码生成鼻祖,与GitHub深度绑定
优势:Copilot底层引擎,代码补全最丝滑
场景:实时编程辅助
CodeLlama 70B
特点:开源代码模型标杆,多语言支持
优势:私有化部署无版权风险
场景:企业离线代码助手
StarCoder3
特点:开源社区共建,支持长代码
优势:完全开放,可商用
场景:代码Agent、自动软件开发
CodeGeeX4
特点:国产代码模型,适配国内工程场景
优势:中文注释、国产框架支持好
场景:国内研发团队IDE辅助
具身智能模型
OpenClaw-Base
特点:具身原生,支持机械臂/机器人调度
优势:Claw生态标准底座,工具链统一
场景:机器人控制、无人设备调度
ThinkerV2
特点:优必选具身模型,物理推理强
优势:真机落地经验丰富
场景:人形机器人、工业操作
RT-6 / Gen-1
特点:端到端机器人控制,视觉-动作闭环
优势:工业级操作成功率高
场景:工业机器人、自动化产线

二、协议与接口层(神经总线)
MCP(Model Context Protocol)
特点:模型-工具-智能体-平台统一通信协议
优势:一次接入,全生态互通,解耦厂商绑定
场景:跨平台智能体、多工具协同、标准化Agent
OpenAI API 兼容协议
特点:行业事实标准接口
优势:几乎所有框架/平台都支持
场景:快速接入模型,无需定制开发
Ollama OpenAPI
特点:本地模型统一接口
优势:轻量化、本地部署、低延迟
场景:私有化模型服务、端侧推理
三、智能体框架层(骨骼系统)
通用Agent框架
LangChain
特点:最成熟Agent框架,组件极丰富
优势:工具调用、RAG、工作流完整
场景:企业级复杂Agent开发
LlamaIndex
特点:专注RAG与知识库
优势:文档索引、检索精度高
场景:企业知识库、内部问答系统
AutoGen / CrewAI
特点:多智能体协同,角色分工
优势:团队式AI作业,复杂任务拆解
场景:项目自动化、多角色业务流程
MetaGPT
特点:软件公司智能体,全流程开发
优势:需求→设计→代码→测试全自动
场景:AI软件开发、低代码平台
Claw 系标准框架
OpenClaw
特点:开源具身智能+数字Agent标准
优势:生态中立,可扩展,厂商共建
场景:机器人、智能体、IoT统一调度
QClaw
特点:微信生态原生Claw
优势:公众号/小程序/企微深度打通
场景:微信智能客服、私域Agent
MicClaw
特点:字节系企业级Claw
优势:飞书、抖音生态互通
场景:企业办公、内容生态Agent
JoyClaw
特点:京东电商物流Claw
优势:供应链、仓储、无人车调度
场景:电商自动化、物流机器人
ArkClaw
特点:飞书协同Claw
优势:飞书审批/文档/会议打通
场景:办公自动化、企业协同Agent
NeoClaw
特点:新石器无人车Claw
优势:室外移动机器人调度
场景:末端配送、园区物流
轻量化Agent框架
AgentLite
特点:极简、高性能、低代码
优势:快速搭建轻量Agent
场景:个人助手、小型工具
RagFlow
特点:专注RAG快速部署
优势:开箱即用,支持多模型
场景:文档问答、知识库
四、开发与编排平台层(施工平台)
低代码智能体平台
Coze
特点:字节智能体平台,零代码搭建
优势:插件丰富,多端发布
场景:普通开发者快速做Agent
Dify
特点:可视化工作流,RAG+Agent一体
优势:部署简单,私有化友好
场景:企业AI应用搭建
FlowiseAI
特点:开源可视化编排
优势:高度自由,可二次开发
场景:开发者自定义工作流
流程自动化平台
n8n
特点:开源自动化引擎,API编排强
优势:连接任意系统,无需代码
场景:系统对接、数据同步、业务自动化
Zapier / Make.com
特点:SaaS级自动化
优势:海量应用预置
场景:轻量业务流、个人效率工具
多模态生成平台
ComfyUI
特点:Stable Diffusion可视化节点编程
优势:高度可控,插件生态极强
场景:AI绘画、视频生成、定制工作流
InvokeAI
特点:本地图像生成平台
优势:隐私安全,功能全面
场景:设计师本地出图
本地推理平台
Ollama
特点:一行命令跑模型
优势:极简部署,支持海量模型
场景:开发者本地测试、私有化部署
LM Studio
特点:桌面端本地模型管理
优势:图形化界面,新手友好
场景:个人本地AI体验
llama.cpp
特点:C++高性能推理
优势:极快速度,低资源占用
场景:端侧部署、嵌入式AI
五、AI编程工具层(工程师武器)
Cursor
特点:AI原生IDE,全流程代码生成
优势:项目级理解,重构能力强
场景:程序员主力开发工具
GitHub Copilot
特点:实时补全,代码提示
优势:生态最广,编辑器全覆盖
场景:日常编码辅助
Windsurf
特点:大型项目自动开发
优势:架构级理解,自动迭代
场景:完整软件项目生成
Claude Code IDE
特点:超长代码上下文
优势:一次性分析全项目
场景:代码审查、重构、迁移
六、终端应用层(普通用户界面)
C端对话助手
ChatGPT App
特点:全球用户最多,能力最稳
优势:综合体验最佳
场景:日常问答、学习、创作
Kimi
特点:长文本,文件解析强
优势:文档阅读无敌
场景:论文、报告、PDF分析
豆包
特点:中文流畅,多模态均衡
优势:国内生态完善,免费额度高
场景:普通用户日常AI助手
Claude App
特点:安全合规,长上下文
优势:隐私友好
场景:敏感内容处理
办公AI
Microsoft 365 Copilot
特点:Office全套件打通
优势:深度嵌入办公流程
场景:职场自动化
WPS AI
特点:国产办公一体化
优势:轻量、免费、易用
场景:国内用户文档处理
飞书/钉钉AI
特点:协同办公原生AI
优势:组织内沟通自动化
场景:企业办公、会议纪要
七、层级关系·意义·产业局势
1. 模型决定智能上限
闭源模型负责高价值任务
开源模型负责私有化与低成本
具身模型负责物理世界执行
2. 框架决定工程能力
LangChain/AutoGen 构建复杂逻辑
Claw 系列统一机器人+数字世界调度
3. 平台决定落地门槛
低代码平台让业务人员也能做AI
专业平台支撑企业级系统
4. MCP 决定生态未来
MCP 是AI时代HTTP
不兼容MCP将被生态淘汰
5. Claw 生态格局
OpenClaw = 安卓开源底座
QClaw / JoyClaw / MicClaw = 各大厂商定制OS
最终形成统一协议、割据场景的格局
6. 用户分层格局
普通用户 → 用App
业务人员 → 用低代码平台
开发者 → 用框架+API
算法人员 → 训模型、改框架
7. 产业终局趋势
- 模型分层固化,顶级闭源+海量开源
- Agent取代对话AI成为主流形态
- MCP统一接口,Claw统一智能体调度
- 端云协同,本地实时+云端深度推理
- 人人可用AI,企业全面Agent化
夜雨聆风