大模型核心技术与应用(微课视频版)pdf电子书下载

作者:薛鹏
出版社:清华大学出版社
出版时间:2025年07月
编辑推荐
本书深入浅出地介绍了人工智能和大模型的核心概念和算法,以及这些技术是如何发明和发展的。通过阅读本书,读者能够理解大模型背后的技术,感受到它所带来的改变。
内容简介
本书从大型模型的结构讲起,让读者了解大型模型的内部实现原理,然后讲解如何在特定任务下对大型模型进行预训练、有监督的微调,以及进行强化学习。通过对模型采用不同方法的训练,持续改进模型在特定任务上的性能。最后,本书将与读者一起探讨如何利用大型模型开发大模型时代的智能应用。
本书共9章,第1章讲解大型模型发展的历史及其带来的变革。第2章深入讲解大型模型内部结构的演进。第3章会尝试自己运行一个大模型。第4章介绍大型模型对模型训练和推理过程中带来的技术挑战和解决办法。第5章讲解如何进行大型模型的预训练以获取大模型的基本能力。第6章讲解如何对大模型进行有监督的微调,使大型模型输出与人类意图对齐。第7章讲解如何通过强化学习进一步提升大型模型的表现。第8章讲解如何对大模型进行评估。第9章讲解如何利用大模型构建智能应用。
本书适合有一定深度学习基础的读者,帮助他们从原理到应用,快速了解大型模型的原理、训练方法,并利用大型模型进行智能应用的开发。
作者简介
薛鹏,深圳力维智联技术有限公司人工智能首席科学家,上海迥灵信息技术有限公司CTO,原IBM AI产品Tech Lead。负责研发多款AI产品,十五年人工智能技术应用经验。目前致力于大模型平台产品研发和大模型技术行业应用。
目 录
本书源码
4.4.2在PyTorch里进行混合精度训练
第6章大模型的监督微调(13min)
6.1对话模板
6.2只关注回答
6.3噪声嵌入微调
6.4SFT Trainer
第7章大模型的强化学习(69min)
7.1强化学习基础
7.1.1强化学习里的基础概念
7.1.2策略梯度算法
7.1.3ActorCritic算法
7.1.4广义优势估计算法
7.2近端策略优化
显示全部信息
前 言
时间回到2010年,笔者刚刚加入IBM SPSS Modeler的研发团队,从此开始了笔者在人工智能领域的职业生涯。转眼间,这段旅程已经持续了十五年。这十五年里,人工智能的发展波澜壮阔,笔者有幸站在科技的潮头,见证了3次极具意义的浪潮。每次浪潮都代表了人类对于智能的探索迈入了新的阶段,每次浪潮也深刻地改变了科技的边界,社会的面貌,以及我们的日常生活。
素材(源码)等资源: 扫描目录上方的二维码下载。
薛鹏
2025年5月于西安

夜雨聆风