第二课:初识大模型
本课目标:理解AI从1.0到2.0的演进,以及大模型与通用人工智能的关系,建立正确的AI认知框架,明白AI财税系统的价值所在。
01 从AI1.0到AI2.0的演进线
演进线:
AI1.0 感知智能时代
↓
↓(大约2022年前后,ChatGPT出现为标志)
↓
AI2.0 认知智能时代← 现在财税系统就在这个时代
02 AI1.0:感知智能时代
专业定义:感知智能是指机器具备对图像、语音、文字等信号进行识别和分类的能力。本质是模式识别,即从大量数据中学习规律,对输入进行判断和分类,但不具备理解、推理和生成能力。
白话理解:AI1.0能【看懂】和【听懂】,但不能【想】也不能【说】。它只能告诉你【这张图是猫】,但没法跟你讨论猫为什么可爱。
代表产品:
产品 | 做的事 |
人脸识别 | 识别这张脸是不是你 |
语音识别 | 把你说的话转成文字 |
图像分类 | 判断这张图是猫还是狗 |
垃圾邮件过滤 | 判断这封邮件是不是垃圾邮件 |
OCR识别 | 把发票图片转成文字数据 |
03AI2.0:认知智能时代
专业定义:认知智能是指机器具备理解语义、逻辑推理、知识运用和内容生成的能力。以大语言模型(LLM,Large Language Model)为核心驱动,能够进行复杂的语言理解、跨领域推理和创造性输出。
白话理解:AI2.0不只能【看懂】,还能【理解】、【推理】、【回答】、【创作】。你问它【这张发票能不能抵扣】,它能给你分析原因,而不只是识别数字。
专业定义:AIGC,全称 AI Generated Content(人工智能生成内容)。指由AI模型自动生成的文字、图像、代码、音频、视频等各类内容。
白话理解:过去内容是人写的(PGC)或用户写的(UGC),现在AI可以自己生成(AIGC)。
代表应用:
应用 | 产品例子 |
文字生成 | ChatGPT、DeepSeek、Claude |
图像生成 | Midjourney、Stable Diffusion |
代码生成 | GitHub Copilot |
财税场景(企业的方向) | 自动生成会计凭证、税务报告、经营分析报告 |
05大模型(LLM)
专业定义:大语言模型(Large Language Model,LLM)是基于Transformer架构,使用海量文本数据训练的神经网络模型。参数量通常在数十亿到数千亿级别,具备语言理解、逻辑推理、知识问答、内容生成等多种能力。
白话理解:大模型就是一个【读过几乎所有书】的超级大脑。它通过阅读互联网上的海量文字,学会了语言规律和各种知识,然后能和你对话、帮你处理任务。
代表大模型:
DeepSeek → 企业员工可能在用它做财税问答
Claude→ “想办法”在用,顶级
通义/文心 → 财税场景常用
06通用人工智能(AGI)
专业定义:通用人工智能(Artificial General Intelligence,AGI)是指具备与人类同等或超越人类的,跨领域学习、推理、规划和解决问题能力的AI系统。与专用AI不同,AGI能够在任意领域完成任意智力任务,无需针对特定场景训练。
白话理解:现在的AI是【专才】——识别发票的不会聊天,下棋的不会写代码。AGI是【全才】——什么都会,就像人一样。
大模型与AGI的关系:
大模型(现在)AGI(未来)
↓↓
专才、需要引导全才、自主思考
像一个很博学的员工像一个完整的人
需要你给它明确任务自己发现问题解决问题
每一次技术升级,表面上看是工具在变化,本质上看,都是工作方式在重构。
从AI1.0到AI2.0,变化的不只是“识别更准了”,而是机器第一次开始具备了“理解、推理、生成”的能力。这也意味着,企业财税工作正在从过去的“人工处理”,逐步走向未来的“AI+人工协同”。
对于企业来说,真正重要的,从来不是追逐某个新名词,而是看清趋势、理解规律、提前布局。谁先建立起对大模型和AI财税系统的正确认知,谁就更有可能在下一轮效率升级和管理升级中抢占先机。
未来已经开始,关键不是AI会不会来,而是我们是否已经准备好,真正用好它。
夜雨聆风