






Software community
软件学社
解码人工智能:
科技创新与项目实践分享
内容导入
从RNN到GNN,时序建模与图结构学习正悄然成为智能时代的底层引擎。我们曾惊叹于RNN以极简的隐藏状态完成信息循环,也见证过LSTM与GRU如何用记忆机制提升序列建模能力。而如今,图神经网络将信息传递从“链条”推向“网络”——节点与边共同编织出更复杂的推理路径。本期活动,我们将带你从经典递归网络出发,一路走向GCN与图神经网络的核心机制,看懂论文示意图背后的技术演进。
01
基础架构:
时序循环模型的通用范式

· FIRST ·


本次分享中,我们首先以这张时序循环模型的通用架构图为引,为大家拆解了循环神经网络(RNN)及其变体的底层工作逻辑。
在这张图里,我们可以清晰看到循环模型的基础运行范式:

🧩下方标注为「Input」的序列 x1,x2...,xn,是模型按时间步依次接收的输入信息;
🧩初始隐藏状态h0会与每一步的输入xt共同作用,生成当前步的隐藏状态ht;
🧩 隐藏状态序列 h1, h2, ...,hn 既会作为信息传递的载体,向后传递到下一个时间步,也会直接生成对应输出 y1, y2, ...,yn,也就是上方标注的「Prediction」。
这种 “循环传递、步步更新” 的结构,正是 RNN、LSTM、GRU 这类时序模型的共同骨架。也正是基于这一基础架构,后续才衍生出了不同门控设计的优化方案,也就是我们接下来要讲的三种模型的演进脉络。

接下来的分享中,我们以现场展示的这张RNN、LSTM、GRU单元结构对比图为核心载体,逐一层级拆解了时序模型的三代演进脉络,带大家清晰读懂三种模型的设计逻辑与核心差异。图中从左至右,依次呈现的是循环神经网络(RNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)的核心单元结构,每一种结构的迭代,都对应着时序建模技术的一次优化与突破。
三者的核心差异,本质上是「如何在循环结构中高效传递、筛选与更新时序信息」的设计取舍,也是从基础到优化、从复杂到精简的迭代思路体现:
01
作为时序模型的基础雏形,RNN以单一隐藏状态为核心,完成时序信息的循环传递,其结构极简、计算成本极低,无需复杂的门控调控,能快速实现简单短序列的信息建模,但也正因为缺乏专门的信息筛选与保留机制,在处理长序列任务时,极易出现梯度消失或梯度爆炸问题,无法有效捕捉长距离的信息依赖关系,难以适配复杂的时序建模需求。
02
为解决RNN的核心痛点,LSTM应运而生,它通过创新性引入细胞状态(长期记忆载体)与三重门控机制——遗忘门、输入门、输出门,构建了一条独立的长期记忆传递“高速公路”。其中,遗忘门负责筛选并丢弃无效的历史信息,输入门负责将当前有效输入更新至细胞状态,输出门则控制细胞状态中哪些信息需要传递至当前隐藏状态,从根本上缓解了长序列依赖建模中的梯度消失问题,大幅提升了模型对复杂时序信息的捕捉能力。
03
而GRU则是在LSTM的基础上,进行了轻量化优化与结构精简,它摒弃了LSTM中独立的细胞状态,将门控机制简化为重置门与更新门:重置门负责控制历史隐藏状态的使用比例,决定哪些历史信息可用于生成当前候选状态;更新门则兼顾了LSTM中遗忘门与输入门的核心功能,控制历史信息的保留与当前信息的更新比例。这种精简设计,在保留LSTM核心建模能力、基本解决长序列依赖问题的同时,大幅减少了模型参数量,降低了计算成本,让模型训练效率得到显著提升。
这张对比图不仅直观呈现了三者在单元结构上的显著差异——从RNN的单一循环结构,到LSTM的多门控+细胞状态复杂结构,再到GRU的双门控精简结构,更清晰展现了时序模型从“简单循环、功能基础”到“门控增强、精准建模”,再到“轻量化优化、高效适配”的完整演进逻辑,也让大家在可视化的对比中,快速理解不同模型的设计初衷与适用场景,深化对时序建模核心逻辑的认知。
02
智启新未来:
图神经网络GNN 导览

· SECOND ·


人工智能不只会写文章、识别图片、生成视频,它还可以理解“关系”。
在现实世界中,很多数据并不是孤立存在的。人与人之间有社交关系,用户和商品之间有推荐关系,论文之间有引用关系,分子内部也有原子之间的连接关系。
这些对象之间的联系,可以用一种特殊的数据结构来表示——图 Graph。

图片1【图标示意图】
01
什么是图?
图1可以简单理解为由节点和边组成的数据结构。结合上述图片来看,图中的每一个圆点都可以看作一个节点,每一条连接线都可以看作一条边。
节点代表具体对象,比如人、商品、概念或原子;边代表对象之间的关系,比如好友关系、购买关系、引用关系或化学键。
所以,图不仅记录“有哪些对象”,更强调“对象之间怎样连接”。
02
生活中的很多数据,都是图
图2展示的是由像素组成的笑脸图案。表面上看它是一张图片,但从数据角度看,每个像素都可以看作一个小节点,相邻像素之间存在位置关系。
类似地,社交平台中的用户关系、推荐系统中的用户与商品关系、知识图谱中的概念关系,都可以被建模成图。
因此,只要一个问题中存在“对象”和“对象之间的联系”,它就有可能用图来表示。

图片2【笑脸像素图】
03
什么是图神经网络 GNN?
图神经网络,英文叫 Graph Neural Network,简称 GNN。它是一类专门处理图结构数据的神经网络。
普通模型往往更关注单个数据本身,而 GNN 不仅关注一个节点自己的信息,还会关注它连接了哪些节点、周围节点有什么特征。
例如在推荐系统中,GNN 不只是看一个用户买过什么,还会分析这个用户和哪些商品、哪些用户、哪些兴趣群体产生过联系。通过这些关系,模型就能更好地判断用户可能喜欢什么。
简单来说,GNN 的优势就是:它不只分析单个对象,还能分析对象之间的连接关系。
04
GNN 是怎么工作的?
图3展示的是 GNN 的核心工作方式:信息传递。
可以把图中的每个节点看成一个人。刚开始时,每个节点只知道自己的信息;经过一轮信息传递后,它会接收相邻节点的信息;经过多轮信息传递后,它就能逐渐了解到更大范围内的图结构。
简单来说,GNN 的工作过程就是:节点先接收邻居的信息,再把这些信息进行汇总,最后更新自己的表示。这样一来,一个节点的特征就不再只包含自身信息,也包含了周围关系网络的信息。
所以,GNN 的强大之处在于:它不仅能看见“点”,还能理解“点与点之间的连接”。

图3【信息传递示意图】
从节点到连接,从关系到智能,图神经网络让人工智能不只看见单个数据,也能理解数据背后的复杂关系。
智启新未来,科创向苍穹。让我们一起走进 GNN 的世界,感受学术科技的魅力。
本文部分内容与配图参考:
Sanchez-Lengeling, Benjamin, Emily Reif, Adam Pearce, and Alexander B. Wiltschko. “A Gentle Introduction to Graph Neural Networks.” Distill, 2021. DOI: 10.23915/distill.00033。
03
活动结语

· END ·


从RNN的轻量循环,到GNN与GCN的结构化信息传递,每一种模型都在定义信息如何被“看见”与“理解”。分类、回归、链接预测——GNN的能力远不止于理论图示。希望通过本次分享,你能在节点与边的交错中,找到属于自己的技术切入点。软件学社,下一场深度技术漫谈,我们再见。
1

1


审核:戴世通 刘晟 王彬
编辑:张小敏 陈畇如 贺浩蓉
夜雨聆风