通过上一期对显卡品牌厂商、以及显卡的迭代和型号系列有了初步的了解,越新的显卡越高级的型号往往性能越强。那如何对比显卡的性能差距到底体现在什么地方呢?这一期我们来通过显卡的工作原理讲解一下它们的参数。
内容为新手向,主要以基础知识为主,复杂的内容和扩展知识,作为思考题列在文末,供选择性学习。
第六章:认识显卡(二)性能参数
在讨论显卡的性能参数之前,想告诉大家的是:我们普通消费者电脑主要是用于生活娱乐(如游戏影音等),选择显卡只要通过天梯图或者跑分性能表确定想要的档位再根据测评选择品牌和型号即可。因为一款显卡的型号就确定了这款显卡的GPU、显存配备,也就基本定型了它的性能。细节的参数往往用于横向做对比。
显卡的硬件构成
网上随机找的一张图片作为例子:

一张显卡的内部简化结构就是这些(实际还有其他模块),外面的带有风扇的外壳是显卡的装甲以及散热模块。
从外观上看,一块显卡像是一台缩小版的电脑主机:有主板、有计算和控制模块、有内存、有独立供电。这些模块互相协作,共同决定了一块显卡的性能。
显卡的简单工作原理
为方便理解,我们先以游戏场景来简单了解显卡的运作,顺便再说性能参数。假设我们正在玩游戏,游戏角色处在屏幕中央,周围的环境有植被建筑和游戏NPC等。那此时的电脑是怎么工作的?我们又是怎么看到这些画面的呢?
当我们控制角色进入一个场景,此时:
为能直观了解,此图为简化流程
通过上图就可以直观看到,影响显卡处理速度的因素有以下方面:
1、输入速度(PCIe通道);
2、显存性能(显存容量、显存频率、显存位宽);
3、GPU性能(架构、流处理器数量、核心频率);
PCIe通道
显卡通过主板与CPU交流数据的通道,通过显卡的金手指插在主板插槽上实现。主流PCIe通道类型如下:

目前最新一代的显卡均使用PCIe5.0版本。PCIe4.0则使用在前代显卡,如N卡的RTX40系和A卡的RX7000系及之前。
同一代显卡中,高端及旗舰往往使用×16通道,中端及入门多使用×8通道。
PCIe带宽决定了显卡和CPU之间交换数据的速度上限。不过我们普通消费者不用过多纠结,即便是PCIe4.0×8(如RTX 4060)的带宽也足够使用。在专业计算或者工程生产力领域,PCIe带宽才有可能成为瓶颈。
显存性能
显存就像电脑里的内存,它是专门为显卡的GPU服务的。在游戏运行时,CPU会把渲染所需的原料(顶点贴图纹理光影等)发给显存存储下来。GPU核心进行高强度的计算渲染时,会以极高的频率在显存提取或暂存数据。可以说显存就是GPU的工作台,因此显存会影响显卡的性能。
显存的参数:容量、显存频率、位宽、显存类型
容量决定了显卡能装下多大的场景、多精细的数据。因此显存几乎可以说是越大越好。如果显存过小,在渲染大场景高精模型高清材质时就容易盛不下,导致“爆显存”。这时显卡需要从外部的系统内存借用空间,导致帧率下降甚至卡顿。目前主流显卡显存容量基本是8G起步。
显存类型、显存频率、位宽共同决定了GPU提取和存放数据的速度。存取速度越快,就能为越快的渲染速度做准备。
它类似于我们之前讲解内存的频率和位宽。频率是显存每秒钟的传输次数,我们可以类比为车辆行驶速度;位宽是每传输一次携带的数据量,我们可以类比为道路宽度(能容纳的车辆数)。

频率越高、位宽越大,就代表单位时间能传输的数据量越大。我们把显存每秒能传输的数据量称为显存带宽:
显存等效频率×(显存位宽÷8)=显存带宽
等效频率我们在内存章节讲过,这里比较类似就不再重复。只需要了解:同样显存类型下,显存基础频率高,等效频率就高。
显存的类型目前主要有GDDR6和GDDR6X。GDDR6X可以理解为GDDR6的升级版,相同条件下,GDDR6X的等效频率更高。
显存容量和显存速度共同决定了显存的性能。两者均衡才能发挥显卡的性能。
GPU性能
GPU芯片是整个显卡的核心。它类似于CPU在电脑中的作用,负责整个显卡的控制和计算。但它与CPU又不完全相同。
以两款级别差不多的CPU和GPU举例:

CPU就像是一个只有几位教授的团队,每位教授都很厉害,他们能各自分工来快速处理非常复杂的科研任务。GPU则像是一所有着成千上万名普通学生的学校,所有学生能同时处理简单的题目。
GPU的参数:CUDA核心数(流处理器)、核心频率、缓存
CUDA核心数:CUDA核心是整张显卡的基本计算单元,核心数越多,同一时间能并行处理的任务量越大、渲染出的图形也越多。但这只是在同样设计方案和架构下对比。
越新代的架构设计代表越高级的流水线,同样数量的工人工作的效率自然不同。
例如基于Ampere架构的RTX 3060Ti,CUDA核心有4864个;而基于最新Blackwell 2.0架构的RTX 5060,CUDA核心只有3840个。但RTX 5060在游戏方面性能反而要高出15%左右。
另外NVDIA和AMD两家的GPU也不能单纯对比核心数,因为设计方案不同。
核心频率:GPU的频率类似于之前讲过的CPU频率,基本概念就不说了。同样分为基础频率和加速频率,根据不同场景的负载动态调整。
如果说核心数是流水线工人,频率就是工人的工作速度。1000个工人每人每天搬1件货,和500个工人每人每天搬2件货工作效率其实是一样的。所以频率也需要结合设计架构和核心数量来看。
这里提一下显卡的超频。出厂预设超频的显卡确实是一大亮点,但是实际应用中提升有限。超频的频率和性能的提升大约都在个位数,因此不必盲目追求。
缓存:GPU的缓存也类似于之前讲过的CPU缓存。是为了弥补GPU到显存中存取数据的延迟而在GPU中放置的临时快捷存储,理论上讲当然是越大越好。
GPU的缓存同样也分为多个层级,根据设计不同大致可分为L1、L2和末级缓存。数字越小容量越小、距离核心越近、速度越快。英伟达的缓存简单设计思路是减少缓存层级优化算法,让缓存能尽量在距离较近处命中;AMD的思路是加大末级缓存,靠大容量提升缓存命中率。两种没有对错优劣,都是为了同一目标。
GPU的核心数、核心频率、缓存共同决定了GPU的性能,而GPU的设计架构则是这一切的基石。
总结
显卡的基本性能参数包括:
显存:显存容量、显存类型、显存频率、显存位宽
GPU:架构、核心数量、核心频率、缓存
参数主要用于横向对比两款显卡的差别。实际单款显卡的性能基本都可以体现在型号上,型号越新越高级,往往性能也就越强。
课后思考题&扩展查阅
1、购买显卡时没注意,到手发现显卡的金手指比主板上显卡PCIe插槽短了一截,那还能用吗?
2、AMD RX 9060显卡拥有1792个核心,NVDIA RTX 2070 SUPER有2560个核心。两款显卡能不能通过核心数量对比性能差距。
感觉有用,可以关注名片
也可以分享给给身边的朋友
持续分享电脑硬件知识
夜雨聆风