【科普114·图文】生成式 AI 变形术:一键玩转文字、美图与短视频

图片来源于版权图库

　　AI如今能轻松地帮助我们写文章、画图片、生成视频，看似魔法一般，实则全依靠严谨的数学逻辑：AI从海量例子中提炼规律，再从规律中重新组合出全新的内容，从而生成我们想要的文章、视频和图片。这背后的技术原理又是怎样实现的？一文了解AI的三种“变形术”——

文字生成：万亿次词语接龙

　　大语言模型经过海量文本训练，核心任务就是根据前文猜测下一个词语，不断调整内部参数，牢记词语搭配、句式逻辑与语言习惯。

　　AI其实并不理解文字的含义与情感哲理，只是按照概率依次推算字词，连贯通顺的文章就这样逐词生成。它并非摘抄内容，而是依靠语言规律自主创作文字。

图片生成：反向去除画面噪点

AI绘画则依靠扩散模型运行。清晰图片不断叠加噪点会变得模糊杂乱，AI则反向学习，从随机杂乱的噪点画面开始，一步步迭代优化像素色彩与排布。结合文字提示，反复清理噪点、规整画面，最终还原出精致完整的图像，用有序代替混乱，完成图像创作。

视频生成：连贯流动的时空画面

图片来源于版权图库

　　我们都知道，视频是由连续帧图片组成的，所以AI在生成视频时不仅要绘制单张画面，还要学习物体运动规律。模型通过大量视频素材，掌握光影变化、动作轨迹与画面衔接逻辑，在空间生成图像，在时间衔接动态，让画面自然流畅变化，制作出连贯自然的动态视频。

AI的利弊与时代思考

　　AI大幅降低了创作门槛，方便我们学习、办公与艺术创作，让普通人也能轻松完成多样作品。但AI存在明显局限：不懂现实常识、自带数据偏见、版权归属模糊，还存在深度伪造信息的风险。目前各国都出台相关法规约束AI发展，要求标注AI内容、添加溯源水印，规范技术健康发展。未来AI会朝着多模态融合、轻量化、实时互动不断升级。

　　AI只是创作工具，无法替代人类独立思考。我们可以合理借助AI辅助学习创作，却不能依赖AI放弃自主判断。守住独立思考与责任底线，才是我们必备的数字素养。

来源：科普中国

编辑：魏晓丽

校对：高淑青