引言
目录
一、模型训练的本质:不停调整参数,从数据里摸清规律
二、模型如何理解世界:把文字、图片和声音,变成能计算的向量
三、模型如何从错误中学习:先预测→再犯错→算清误差→调整参数
四、大模型为什么要预训练和微调
五、判断模型是否可用:泛化能力、过拟合、鲁棒性、真实场景
一、模型训练的本质
模型的“输入”与“输出”
参数、权值、偏置
二、模型如何理解世界
把文字、图片和声音变成向量
三、模型如何从错误中学习
预测→犯错→计算误差→调整参数
不断调参、被形象调侃为“炼丹”
四、大模型为什么要预训练和微调
模型的“通识教育”与“岗位培训”
预训练(Pre-training)
微调(Fine-tuning)
五、判断模型是否可用
泛化能力、过拟合、鲁棒性
真实场景
【鲁棒性与泛化能力的区别】

做个小结

夜雨聆风