从0到1,了解企业AI财税系统(第3课)

第3课：主流大模型与应用产品
本课目标：了解国内外主流大模型的特点，掌握开源vs闭源的核心差异，学完之后你能知道你
的企业该选哪个模型、为什么选、怎么选的问题。

01主流大模型全景

先看全局地图：

大模型阵营

├── 国外

│├── GPT系列（OpenAI）← ChatGPT背后

│├── Claude（Anthropic）← 顶级的

│├── Gemini（Google）

│└── LLaMA系列（Meta）← 开源

└── 国内

├──DeepSeek（深度求索）

├──Qwen/通义千问（阿里）

└──GLM系列（智谱AI）← 清华系

GPT系列

专业定义：GPT（Generative Pre-trained Transformer）系列是由OpenAI研发的自回归语言模型。采用Transformer解码器架构，通过大规模无监督预训练和人类反馈强化学习（RLHF）训练。GPT是业界综合能力标杆之一。

白话理解：GPT是大模型里的【老大哥】，ChatGPT就是它的应用产品。它开创了现在这个AI时代，其他模型很多都在追赶它。

GPT的使用意义：

优点：能力强、生态最成熟、插件最多

缺点：

- 数据传到美国服务器 → 财税数据合规风险

- 收费较贵

- 在国内访问需要特殊网络

结论：国内企业大概率不会直接用GPT

Claude

专业定义：Claude是由Anthropic公司研发的大语言模型，以安全性、长上下文处理能力和指令遵循能力著称。Claude系列，在长文档理解、逻辑推理和代码生成方面表现突出。

白话理解：Claude是GPT的强力竞争者，特点是【更听话、更安全、能处理超长文本】。

Claude的使用意义：

优点：

- 长上下文能力强 → 适合处理长篇财务报告

- 逻辑推理准确 → 适合复杂财务税务判断

- 指令遵循好 → 输出格式稳定，适合生成凭证

缺点：同GPT，有数据出境合规风险

结论：个人使用很好，企业产品集成需评估合规

Gemini

专业定义：Gemini是Google DeepMind研发的多模态大语言模型，原生支持文本、图像、音频、视频等多种输入形式。与Google搜索、办公套件深度集成，具备强大的实时信息获取能力。

白话理解：Gemini是Google出的模型，最大特点是【多模态】——不只能读文字，还能看图、听声音，背靠Google生态。

多模态能力对发票图像识别有潜力，但同样有数据合规问题，目前在国内财税产品中应用较少。

DeepSeek（重点关注）

专业定义：DeepSeek是深度求索公司（幻方量化旗下）研发的大语言模型系列，以极低训练成本实现顶尖性能著称，R1系列具备强大的数学推理和逻辑链（Chain of Thought）能力，且完全开源。

白话理解：DeepSeek是2024年底横空出世的国产黑马，用很少的钱训练出了接近GPT-4的效果，震惊了整个AI圈。最重要的是它开源且免费。

DeepSeek的使用意义：

开源 → 可以私有化部署，数据不出公司

推理能力强 → 适合财税逻辑判断

成本低 → 创业公司友好

国内公司 → 合规风险小

Qwen（通义千问）

专业定义：Qwen（通义千问）是阿里巴巴达摩院研发的大语言模型系列，包含多种参数规模版本（0.5B到72B），支持中英文双语，提供开源版本和商业API，与阿里云生态深度集成。

白话理解：阿里出的国产大模型，中文能力强，和阿里云绑定，企业用起来比较方便。如果企业基础设施在阿里云，集成成本低。

GLM系列

专业定义：GLM（General Language Model）系列是清华大学KEG实验室与智谱AI联合研发的双语预训练语言模型。采用自回归空白填充训练目标，ChatGLM系列针对中文对话场景优化，最新版为GLM-4。

白话理解：清华系出品，学术背景扎实，中文能力强，在国内企业市场有一定份额。

LLaMA系列

专业定义：LLaMA（Large Language Model Meta AI）是Meta公司发布的开源大语言模型系列。因完全开源免费，成为全球开发者进行模型微调、私有化部署的首选基础模型，催生了大量基于LLaMA的衍生模型。

白话理解：Meta（Facebook母公司）开源的模型，相当于AI界的【安卓系统】——本身是基础，很多公司在它上面二次开发。如果企业未来要做微调，LLaMA是常用的基础底座。

02开源 VS 闭源大模型——选型决策非常关键

开源大模型专业定义：开源大模型（Open Source LLM）是指模型权重、架构及部分训练细节对外公开，允许用户免费下载、部署、修改和二次开发的大语言模型。代表：DeepSeek、LLaMA、Qwen（部分版本）、GLM。

开源白话理解：开源就是【给你图纸，你自己建房子】。你可以把模型下载到自己的服务器上跑，数据不用给任何人。

闭源大模型专业定义：闭源大模型（Closed Source LLM）是指模型权重和核心技术不对外公开，用户只能通过API接口调用服务的大语言模型。代表：GPT-4、Claude、Gemini。

闭源白话理解：闭源就是【只能去餐厅吃饭，厨房你进不去】。你用它的能力，但你的数据要发到对方服务器。

维度	开源模型	闭源模型
数据安全	数据在自己服务器	数据传到对方
合规风险	低	需评估
使用成本	需要自己买服务器	按调用量付费
维护难度	技术要求高	简单，调API即可
能力上限	稍弱（但差距在缩小）	较强
适合阶段	有一定规模后	早期快速验证

对企业建议：

早期：

用闭源API快速搭建企业财税系统底层逻辑，跑通业务流程

中期：

考虑开源模型私有化部署，解决数据合规问题

长期：

结合自有财税和业务数据，基于开源模型做微调

03主流大模型应用产品

注意区分：模型是引擎，应用产品是汽车。

应用产品	背后模型	特点
ChatGPT	GPT系列	最知名，功能最丰富
深度求索	DeepSeek	国产，免费，推理强
通义千问	Qwen	阿里出品，中文强
文心一言	文心系列	百度出品，搜索整合
智谱清言	GLM系列	清华系，学术严谨

这一课我们想讲清楚的，不是“大模型有多热”，而是当AI真正走进企业、走进财税、走进业务现场时，到底该怎么选、怎么用、怎么落地。

模型很多，概念很新，声音也很杂。

但越是在这种时候，越需要回到最本质的问题：企业的业务场景是什么，企业的数据边界在哪里，企业真正要解决的问题又是什么。

没有所谓“最好的模型”，只有“当下最适合你的模型”；

没有一劳永逸的答案，只有基于业务、成本、合规与效率做出的理性判断。

当企业开始学会用产品和业务的视角看待大模型，而不是只被技术名词牵着走，就已经比大多数“只会追风口的企业”更进一步了。

AI的价值，从来不在于知道多少概念，而在于能不能把能力，变成结果；把模型，变成产品；把想象，变成增长。

愿这节课结束之后，带走的不只是几个模型的名字，更是一套更清晰的判断框架。

未来真正拉开差距的，也不是谁最早听说AI，而是谁最早把AI用对、用稳、用出价值。

第3课：主流大模型与应用产品本课目标：了解国内外主流大模型的特点，掌握开源vs闭源的核心差异，学完之后你能知道你的企业该选哪个模型、为什么选、怎么选的问题。

01主流大模型全景

02开源 VS 闭源大模型——选型决策非常关键

03主流大模型应用产品

第3课：主流大模型与应用产品
本课目标：了解国内外主流大模型的特点，掌握开源vs闭源的核心差异，学完之后你能知道你
的企业该选哪个模型、为什么选、怎么选的问题。