今天,我们来聊聊一个大家都在说、但不一定搞得清楚的词——人工智能(AI)。不讲复杂的公式,只讲故事和道理。看完这篇,你就能跟患者、跟家里人说得清楚了。
🤖 一、什么是人工智能?
简单说,人工智能就是"让机器学会思考"的技术。
以前的机器只会按指令办事——你让它加就加,让它减就减。而人工智能不一样,它可以从经验中学习,就像人一样。
💡 图灵测试——怎么判断机器是否"会思考"?
1950年,英国科学家图灵提出了一个方法:把一个人和一台机器分别关在两个房间里,你在外面用文字提问。如果你分不清楚哪个回答来自人、哪个来自机器,那这台机器就"通过了"测试。 这就像你蒙着眼睛尝两道汤——如果尝不出哪个是老厨师做的、哪个是机器做的,那机器的厨艺就算合格了。
📚 二、机器是怎么"学习"的?
我们先说"机器学习"——这是AI最核心的方法。
你教小朋友认苹果,怎么教?给他看一个个苹果:红的、绿的、大的、小的……看多了,他就认识了。机器学习和这一模一样:给机器看大量例子,机器自己总结规律。
🍎 举例:给机器看1万张X光片,标记好哪些是"正常",哪些是"肺炎"。机器看完这些例子,下次给它一张新片子,它就能自己判断了。
机器学习的成果,叫做模型。模型就是机器从大量数据中总结出来的"规律"。
📐 三、从一根线说起——什么是模型?
现在我们来理解"模型",从最简单的开始——一根线。
中学数学里,我们解方程:y = ax + b,数字知道,求 x 和 y。模型做的是反过来的事——x 和 y 都有,求那根"线"的规律(求 a 和 b)。
▼ 二维散点图示意(患病 vs 正常)
🔵 正常患者 🔺 高血压患者 紫线 = 模型找到的分界线
我们把患者数据画到图上,正常的标蓝点,患病的标红三角。然后让机器找一根线,尽量让左边全是正常、右边全是患病。
⚠️ 关键点:模型说的是概率,不是绝对!
生活中,不可能有一根线把所有人分得一清二楚。所以我们找的是那根出错最少、概率最大的线。 这就好比找一位医生,他不一定每次都判断正确,但他正确率最高——我们就用他。 记住这个"概率"的概念,后面讲大模型"幻觉"的时候,还会用到!
📈 四、从直线到曲线——模型越来越聪明
一根直线的模型有时候不够用。现实情况更复杂——数据的规律可能是弯曲的。没关系,我们可以用曲线来拟合!
▼ 曲线分界示意(更复杂的分布)
弯曲的分界线 = 更强大的模型
除了直线和曲线,还有很多不同"形状"的模型,各有所长:
🌲 随机森林——一群树投票决定
由很多棵"决策树"组成,每棵树分别判断,最后少数服从多数,投票出结果。就像开诊断会,多个大夫讨论,比一个人判断更准。
BMI > 28?
是 ↙⚠️ 高风险
否 ↘✅ 继续判断
👥 K近邻算法——看周围的邻居是什么人
新来一个患者,就找他数据上最近的K个"邻居"。如果这K个邻居里大多数是高血压,那他大概率也是。 通俗说:物以类聚,人以群分。
📊 逻辑回归——给出一个概率值
不只说"是"或"否",而是给出一个概率,比如"这位患者有 78% 的可能是高血压"。适合医学诊断场景,让医生自己判断风险高低。
⚡ 支持向量机——找最宽的"走廊"
找那根线时,要求两边的数据点离线尽量远——就像走廊越宽越安全,不容易走错道。对小样本数据很有效。
🧠 五、神经网络——机器的"大脑结构"
模仿人类大脑的结构,科学家发明了人工神经网络。
▼ 单隐层神经网络(小型版)
每条连线都对应一个"参数"——神经网络越大,参数就越多
每个圆圈是一个"神经元",圆圈之间的连线就是"参数"。上面这个小网络只有16个参数,已经有点学习能力了。
参数越多,模型能"记住"和"处理"的信息就越复杂。记住"参数"这个词,后面大模型要用到!
📊 六、特征越多,模型越精准
刚才我们的图是没有坐标轴的。现在加上:横轴 = BMI(体重指数),纵轴 = 血压值,点的颜色 = 是否高血压。这就是2个特征的模型。
▼ 2维特征:BMI × 血压值
加上坐标轴后,每个点代表一位真实患者的数据
再加一个特征——年龄,就变成了3维空间,我们还可以画出来:
📦 3维特征空间
X轴 = BMI | Y轴 = 血压 | Z轴 = 年龄 每个点漂浮在立体空间里,用颜色区分高血压 vs 正常
🧊
4维、5维……100维——我们脑子里无法想象,但机器可以处理!
特征再多,比如再加性别、吸烟史、家族病史……就是高维度了。我们的眼睛画不出4维图形,但机器完全可以在高维空间里找那根"分界线"——只是维度更高的分界"面"而已。
📌 阶段小结
模型 = 从数据中找到的规律(那根线) 模型说的是概率,不是绝对 参数 = 模型里存储规律的"数字" 数据维度越高,模型越精准,参数也越多
🔬 七、深度学习——神经网络叠了很多层
刚才的神经网络只有一个隐藏层,这叫"浅层网络"。如果把隐藏层叠成很多层,就叫深度学习。
▼ 深度神经网络(层数更多)
x
x
x
输入层
输出层
典型深度学习:10层、20层、甚至上百层节点数量:每层几百到几千个
层数越多,节点越多,连线(参数)就越多,模型能学到的规律就越复杂。比如它能识别图片里是猫还是狗,能听懂语音,能做医学影像诊断……
🌍 八、大模型——参数量"天文数字"级别
深度学习层数多了,参数就多了。当参数多到一定程度,模型就"开窍"了——能读懂文字、理解语言、回答问题,这就叫大语言模型(LLM),也就是我们常说的"大模型"。
为什么需要这么多参数?
要理解语言,机器需要把每一个汉字、每一个词、每一句话都变成数字——不只是记住,还要理解上下文关系。
📖 常用汉字约 3500 个,加上标点、符号、数字…… 词语组合 × 句子结构 × 上下文逻辑 × 情感语气…… 再加上图片、声音、视频都要用数字表示…… 大模型相当于读完了人类几乎所有的文字资料,把这些知识全部压缩进参数里。所以参数量,大得惊人。
📊 主流大模型参数量对比
人类大脑神经元约 860 亿个——大模型参数已远超这个数量
👻 九、大模型的"幻觉"——本质还是概率!
用过AI的人都发现,它有时候会"一本正经地说错话"——比如编造一个不存在的论文、说错一个数字。这叫大模型的"幻觉"。
🎯 幻觉的本质:概率游戏
还记得我们最开始说的吗?模型找的是那根"概率最大的线"。大模型生成每个字,都是在选"概率最高的那个词"。 当它遇到自己"没有足够见过"的知识时,它会选概率高的词凑答案——就像一个学生考试不会,却自信地瞎编了一段话。 所以:AI说的话,要当参考,不要当圣旨。
🎓 总结——AI的来龙去脉
1️⃣
人工智能:让机器像人一样"学习思考"——图灵测试是检验标准
2️⃣
机器学习:给机器看大量例子,机器总结规律,生成"模型"
3️⃣
模型:从一根线开始,到曲线、随机森林、神经网络——本质是找高概率的规律
4️⃣
深度学习:神经网络叠很多层,能处理图像、声音等复杂信息
5️⃣
大模型:参数量达到数千亿甚至万亿级,"读"完了人类的知识
⚠️
幻觉:概率游戏的副产品,AI说的话要验证,不可盲信
AI不是神,它是人类智慧的工具。学会用它,也要学会质疑它。作为基层医生,了解AI能帮助你在未来的医疗工作中更好地使用AI辅助诊断工具——知其然,也知其所以然。
#人工智能科普#基层医生#机器学习#大模型#医疗AI
夜雨聆风