第3课:主流大模型与应用产品
01主流大模型全景
先看全局地图:
大模型阵营
├── 国外
│├── GPT系列(OpenAI)← ChatGPT背后
│├── Claude(Anthropic)← 顶级的
│├── Gemini(Google)
│└── LLaMA系列(Meta)← 开源
└── 国内
├──DeepSeek(深度求索)
├──Qwen/通义千问(阿里)
└──GLM系列(智谱AI)← 清华系
GPT系列
专业定义:GPT(Generative Pre-trained Transformer)系列是由OpenAI研发的自回归语言模型。采用Transformer解码器架构,通过大规模无监督预训练和人类反馈强化学习(RLHF)训练。GPT是业界综合能力标杆之一。
白话理解:GPT是大模型里的【老大哥】,ChatGPT就是它的应用产品。它开创了现在这个AI时代,其他模型很多都在追赶它。
GPT的使用意义:
优点:能力强、生态最成熟、插件最多
缺点:
- 数据传到美国服务器 → 财税数据合规风险
- 收费较贵
- 在国内访问需要特殊网络
结论:国内企业大概率不会直接用GPT
Claude
专业定义:Claude是由Anthropic公司研发的大语言模型,以安全性、长上下文处理能力和指令遵循能力著称。Claude系列,在长文档理解、逻辑推理和代码生成方面表现突出。
白话理解:Claude是GPT的强力竞争者,特点是【更听话、更安全、能处理超长文本】。
Claude的使用意义:
优点:
- 长上下文能力强 → 适合处理长篇财务报告
- 逻辑推理准确 → 适合复杂财务税务判断
- 指令遵循好 → 输出格式稳定,适合生成凭证
缺点:同GPT,有数据出境合规风险
结论:个人使用很好,企业产品集成需评估合规
Gemini
专业定义:Gemini是Google DeepMind研发的多模态大语言模型,原生支持文本、图像、音频、视频等多种输入形式。与Google搜索、办公套件深度集成,具备强大的实时信息获取能力。
白话理解:Gemini是Google出的模型,最大特点是【多模态】——不只能读文字,还能看图、听声音,背靠Google生态。
多模态能力对发票图像识别有潜力,但同样有数据合规问题,目前在国内财税产品中应用较少。
DeepSeek(重点关注)
专业定义:DeepSeek是深度求索公司(幻方量化旗下)研发的大语言模型系列,以极低训练成本实现顶尖性能著称,R1系列具备强大的数学推理和逻辑链(Chain of Thought)能力,且完全开源。
白话理解:DeepSeek是2024年底横空出世的国产黑马,用很少的钱训练出了接近GPT-4的效果,震惊了整个AI圈。最重要的是它开源且免费。
DeepSeek的使用意义:
开源 → 可以私有化部署,数据不出公司
推理能力强 → 适合财税逻辑判断
成本低 → 创业公司友好
国内公司 → 合规风险小
Qwen(通义千问)
专业定义:Qwen(通义千问)是阿里巴巴达摩院研发的大语言模型系列,包含多种参数规模版本(0.5B到72B),支持中英文双语,提供开源版本和商业API,与阿里云生态深度集成。
白话理解:阿里出的国产大模型,中文能力强,和阿里云绑定,企业用起来比较方便。如果企业基础设施在阿里云,集成成本低。
GLM系列
专业定义:GLM(General Language Model)系列是清华大学KEG实验室与智谱AI联合研发的双语预训练语言模型。采用自回归空白填充训练目标,ChatGLM系列针对中文对话场景优化,最新版为GLM-4。
白话理解:清华系出品,学术背景扎实,中文能力强,在国内企业市场有一定份额。
LLaMA系列
专业定义:LLaMA(Large Language Model Meta AI)是Meta公司发布的开源大语言模型系列。因完全开源免费,成为全球开发者进行模型微调、私有化部署的首选基础模型,催生了大量基于LLaMA的衍生模型。
白话理解:Meta(Facebook母公司)开源的模型,相当于AI界的【安卓系统】——本身是基础,很多公司在它上面二次开发。如果企业未来要做微调,LLaMA是常用的基础底座。
02开源 VS 闭源大模型——选型决策非常关键
开源大模型专业定义:开源大模型(Open Source LLM)是指模型权重、架构及部分训练细节对外公开,允许用户免费下载、部署、修改和二次开发的大语言模型。代表:DeepSeek、LLaMA、Qwen(部分版本)、GLM。
开源白话理解:开源就是【给你图纸,你自己建房子】。你可以把模型下载到自己的服务器上跑,数据不用给任何人。
闭源大模型专业定义:闭源大模型(Closed Source LLM)是指模型权重和核心技术不对外公开,用户只能通过API接口调用服务的大语言模型。代表:GPT-4、Claude、Gemini。
闭源白话理解:闭源就是【只能去餐厅吃饭,厨房你进不去】。你用它的能力,但你的数据要发到对方服务器。
维度 | 开源模型 | 闭源模型 |
数据安全 | 数据在自己服务器 | 数据传到对方 |
合规风险 | 低 | 需评估 |
使用成本 | 需要自己买服务器 | 按调用量付费 |
维护难度 | 技术要求高 | 简单,调API即可 |
能力上限 | 稍弱(但差距在缩小) | 较强 |
适合阶段 | 有一定规模后 | 早期快速验证 |
早期:
用闭源API快速搭建企业财税系统底层逻辑,跑通业务流程
中期:
考虑开源模型私有化部署,解决数据合规问题
长期:
结合自有财税和业务数据,基于开源模型做微调
03主流大模型应用产品
注意区分:模型是引擎,应用产品是汽车。
应用产品 | 背后模型 | 特点 |
ChatGPT | GPT系列 | 最知名,功能最丰富 |
深度求索 | DeepSeek | 国产,免费,推理强 |
通义千问 | Qwen | 阿里出品,中文强 |
文心一言 | 文心系列 | 百度出品,搜索整合 |
智谱清言 | GLM系列 | 清华系,学术严谨 |
这一课我们想讲清楚的,不是“大模型有多热”,而是当AI真正走进企业、走进财税、走进业务现场时,到底该怎么选、怎么用、怎么落地。
模型很多,概念很新,声音也很杂。
但越是在这种时候,越需要回到最本质的问题:企业的业务场景是什么,企业的数据边界在哪里,企业真正要解决的问题又是什么。
没有所谓“最好的模型”,只有“当下最适合你的模型”;
没有一劳永逸的答案,只有基于业务、成本、合规与效率做出的理性判断。
当企业开始学会用产品和业务的视角看待大模型,而不是只被技术名词牵着走,就已经比大多数“只会追风口的企业”更进一步了。
AI的价值,从来不在于知道多少概念,而在于能不能把能力,变成结果;把模型,变成产品;把想象,变成增长。
愿这节课结束之后,带走的不只是几个模型的名字,更是一套更清晰的判断框架。
未来真正拉开差距的,也不是谁最早听说AI,而是谁最早把AI用对、用稳、用出价值。
夜雨聆风