软件学社社团文化节

Software community

软件学社

解码人工智能：

科技创新与项目实践分享

内容导入

从RNN到GNN，时序建模与图结构学习正悄然成为智能时代的底层引擎。我们曾惊叹于RNN以极简的隐藏状态完成信息循环，也见证过LSTM与GRU如何用记忆机制提升序列建模能力。而如今，图神经网络将信息传递从“链条”推向“网络”——节点与边共同编织出更复杂的推理路径。本期活动，我们将带你从经典递归网络出发，一路走向GCN与图神经网络的核心机制，看懂论文示意图背后的技术演进。

基础架构：

时序循环模型的通用范式

· FIRST ·

本次分享中，我们首先以这张时序循环模型的通用架构图为引，为大家拆解了循环神经网络（RNN）及其变体的底层工作逻辑。

在这张图里，我们可以清晰看到循环模型的基础运行范式：

🧩下方标注为「Input」的序列 x1,x2...,xn，是模型按时间步依次接收的输入信息；

🧩初始隐藏状态h0会与每一步的输入xt共同作用，生成当前步的隐藏状态ht；

🧩 隐藏状态序列 h1, h2, ...,hn 既会作为信息传递的载体，向后传递到下一个时间步，也会直接生成对应输出 y1, y2, ...,yn，也就是上方标注的「Prediction」。

这种 “循环传递、步步更新” 的结构，正是 RNN、LSTM、GRU 这类时序模型的共同骨架。也正是基于这一基础架构，后续才衍生出了不同门控设计的优化方案，也就是我们接下来要讲的三种模型的演进脉络。

接下来的分享中，我们以现场展示的这张RNN、LSTM、GRU单元结构对比图为核心载体，逐一层级拆解了时序模型的三代演进脉络，带大家清晰读懂三种模型的设计逻辑与核心差异。图中从左至右，依次呈现的是循环神经网络（RNN）、长短期记忆网络（LSTM）、门控循环单元（GRU）的核心单元结构，每一种结构的迭代，都对应着时序建模技术的一次优化与突破。

三者的核心差异，本质上是「如何在循环结构中高效传递、筛选与更新时序信息」的设计取舍，也是从基础到优化、从复杂到精简的迭代思路体现：

作为时序模型的基础雏形，RNN以单一隐藏状态为核心，完成时序信息的循环传递，其结构极简、计算成本极低，无需复杂的门控调控，能快速实现简单短序列的信息建模，但也正因为缺乏专门的信息筛选与保留机制，在处理长序列任务时，极易出现梯度消失或梯度爆炸问题，无法有效捕捉长距离的信息依赖关系，难以适配复杂的时序建模需求。

为解决RNN的核心痛点，LSTM应运而生，它通过创新性引入细胞状态（长期记忆载体）与三重门控机制——遗忘门、输入门、输出门，构建了一条独立的长期记忆传递“高速公路”。其中，遗忘门负责筛选并丢弃无效的历史信息，输入门负责将当前有效输入更新至细胞状态，输出门则控制细胞状态中哪些信息需要传递至当前隐藏状态，从根本上缓解了长序列依赖建模中的梯度消失问题，大幅提升了模型对复杂时序信息的捕捉能力。

而GRU则是在LSTM的基础上，进行了轻量化优化与结构精简，它摒弃了LSTM中独立的细胞状态，将门控机制简化为重置门与更新门：重置门负责控制历史隐藏状态的使用比例，决定哪些历史信息可用于生成当前候选状态；更新门则兼顾了LSTM中遗忘门与输入门的核心功能，控制历史信息的保留与当前信息的更新比例。这种精简设计，在保留LSTM核心建模能力、基本解决长序列依赖问题的同时，大幅减少了模型参数量，降低了计算成本，让模型训练效率得到显著提升。

这张对比图不仅直观呈现了三者在单元结构上的显著差异——从RNN的单一循环结构，到LSTM的多门控+细胞状态复杂结构，再到GRU的双门控精简结构，更清晰展现了时序模型从“简单循环、功能基础”到“门控增强、精准建模”，再到“轻量化优化、高效适配”的完整演进逻辑，也让大家在可视化的对比中，快速理解不同模型的设计初衷与适用场景，深化对时序建模核心逻辑的认知。

智启新未来：

图神经网络GNN 导览

· SECOND ·

人工智能不只会写文章、识别图片、生成视频，它还可以理解“关系”。

在现实世界中，很多数据并不是孤立存在的。人与人之间有社交关系，用户和商品之间有推荐关系，论文之间有引用关系，分子内部也有原子之间的连接关系。

这些对象之间的联系，可以用一种特殊的数据结构来表示——图 Graph。

图片1【图标示意图】

什么是图？

图1可以简单理解为由节点和边组成的数据结构。结合上述图片来看，图中的每一个圆点都可以看作一个节点，每一条连接线都可以看作一条边。

节点代表具体对象，比如人、商品、概念或原子；边代表对象之间的关系，比如好友关系、购买关系、引用关系或化学键。

所以，图不仅记录“有哪些对象”，更强调“对象之间怎样连接”。

生活中的很多数据，都是图

图2展示的是由像素组成的笑脸图案。表面上看它是一张图片，但从数据角度看，每个像素都可以看作一个小节点，相邻像素之间存在位置关系。

类似地，社交平台中的用户关系、推荐系统中的用户与商品关系、知识图谱中的概念关系，都可以被建模成图。

因此，只要一个问题中存在“对象”和“对象之间的联系”，它就有可能用图来表示。

图片2【笑脸像素图】

什么是图神经网络 GNN？

图神经网络，英文叫 Graph Neural Network，简称 GNN。它是一类专门处理图结构数据的神经网络。

普通模型往往更关注单个数据本身，而 GNN 不仅关注一个节点自己的信息，还会关注它连接了哪些节点、周围节点有什么特征。

例如在推荐系统中，GNN 不只是看一个用户买过什么，还会分析这个用户和哪些商品、哪些用户、哪些兴趣群体产生过联系。通过这些关系，模型就能更好地判断用户可能喜欢什么。

简单来说，GNN 的优势就是：它不只分析单个对象，还能分析对象之间的连接关系。

GNN 是怎么工作的？

图3展示的是 GNN 的核心工作方式：信息传递。

可以把图中的每个节点看成一个人。刚开始时，每个节点只知道自己的信息；经过一轮信息传递后，它会接收相邻节点的信息；经过多轮信息传递后，它就能逐渐了解到更大范围内的图结构。

简单来说，GNN 的工作过程就是：节点先接收邻居的信息，再把这些信息进行汇总，最后更新自己的表示。这样一来，一个节点的特征就不再只包含自身信息，也包含了周围关系网络的信息。

所以，GNN 的强大之处在于：它不仅能看见“点”，还能理解“点与点之间的连接”。

图3【信息传递示意图】

从节点到连接，从关系到智能，图神经网络让人工智能不只看见单个数据，也能理解数据背后的复杂关系。

智启新未来，科创向苍穹。让我们一起走进 GNN 的世界，感受学术科技的魅力。

本文部分内容与配图参考：

Sanchez-Lengeling, Benjamin, Emily Reif, Adam Pearce, and Alexander B. Wiltschko. “A Gentle Introduction to Graph Neural Networks.” Distill, 2021. DOI: 10.23915/distill.00033。

活动结语

· END ·

从RNN的轻量循环，到GNN与GCN的结构化信息传递，每一种模型都在定义信息如何被“看见”与“理解”。分类、回归、链接预测——GNN的能力远不止于理论图示。希望通过本次分享，你能在节点与边的交错中，找到属于自己的技术切入点。软件学社，下一场深度技术漫谈，我们再见。

审核：戴世通刘晟王彬

编辑：张小敏陈畇如贺浩蓉