E X P
本文约 2620 字,8 张图表,正努力加载…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    这几天PC业界最火爆的新闻肯定就是NVIDIA发布新一代RTX 30系列qy700千亿国际,没有之一。新的qy700千亿国际自然是使用了搭配有一系列新技术的新核心,比如说第二代RT Core啊,第三代Tensor Core啊这些。而对于RTX 3080和RTX 3090这两张高端qy700千亿国际,它们GPU核心的外部,作为仓库的显存也有很大的变化,具体一点就是从GDDR6升级成了全新的GDDR6X。

    想必还有很多读者记得当年在高端Pascalqy700千亿国际上面出现的GDDR5X显存,它是NVIDIA和美光联手合作研发出来的显存种类,随后被提交给了JEDEC进行标准化。不过可惜的是,除了美光之外,没有其他内存厂采用该标准生产显存产品,而qy700千亿国际市场上,除了高端的几张Pascalqy700千亿国际外,也没有别的qy700千亿国际采用GDDR5X显存,就连NVIDIA自己也在之后就转向了更高速的GDDR6显存。

    NVIDIA在2018年的Turingqy700千亿国际上面首次应用了GDDR6显存,在当时,GDDR6显存能够提供比疲态尽显的GDDR5高的多的带宽,也让GDDR5X黯然失色。在GDDR6显存正值壮年的现在,NVIDIA却再次联手美光,在短短的两年之后就推出了它的进阶版本,那么到底是什么原因让NVIDIA决心换用GDDR6X,它的背后隐藏了哪些技术,又能带来哪些好处呢?本期超能课堂就讲一讲GDDR6X显存和它背后的全新技术。

    带宽最高提升50%,突破1000GB/s大关

    显存是qy700千亿国际用来存放各种计算、渲染用素材的仓库,GPU在执行图形计算任务的时候,会不停地从这个仓库里面拿东西,而CPU也会不停地把数据传递过来,要GPU塞进仓库里面备用。那么这个仓库的大小,存取素材的快慢会很明显地影响到GPU的工作效率,也就是说,显存的大小和显存的带宽都会对qy700千亿国际的整体性能产生影响。

    而在如今,1080p分辨率早已普及,不少玩家已经开始用上1440p分辨率或者是4K分辨率的显示器或电视,在更高的分辨率下,游戏的材质、纹理等原始数据的体积越来越大,在进行图形计算时所需的数据交换带宽越来越高,这就需要qy700千亿国际设计厂使用有更高带宽和容量的显存系统,这也是NVIDIA和AMD两家一直在提升他们qy700千亿国际的显存规格的缘由。

    上一代的GDDR6显存将数据的预取宽度从GDDR5时代的8-bit拓宽到了16-bit,这让它的等效频率再次倍增,能够达到14~16Gbps左右,在显存位宽相同的情况下,其带宽较8Gbps的GDDR5显存高75%~100%,进步非常巨大。而GDDR6X做到了更高的等效频率,其范围为19~21Gbps,也就是说,同显存位宽的情况下,它能够增加35%~50%的显存带宽,达到912GB/s~1008GB/s,正式突破了1000GB/s这个大关。

    但是GDDR6X如果强行用传统方式,也就是提升运行频率的方式去获取带宽的话,会遇到非常大的困难,比如说受到工艺的制约,它的运行频率去不到更高,即便是能够实现更高的等效频率,其信号的纯净度也会大打折扣,在电气性能上无法满足要求。

    那么该如何去推高它的等效频率呢?NVIDIA和美光选择从信号的调制方式上入手。

    PAM4信号调制方式

    原本的GDDR系显存在传输数据时使用的是非常原始的二进制信号,再具体一点,该系列显存使用的是NRZ(Non-Return-to-Zero)调制,或者叫做PAM2调制。这种信号调制方式很简单,它用高电平代表1,低电平代表0。如果要提高它的数据传输速率,只要提高显存的时钟频率即可。但现在由于受到制程工艺等各方面因素的限制,显存的时钟频率在现阶段已经很难再攀高,那么该怎么办呢?厂商想到了用新的信号调制机制来提高信号传输的效率,他们选择了已经有较为广泛的PAM4。

    PAM是一种用模拟信号脉冲编码信息的信号调制方式,PAM4是其中较为简单的一种。与NRZ这种仅有高和低两种状态的二进制信号不同的是,PAM4有4种不同的电平值,也就是有4种不同的状态,而每种状态对应着一组0和1的组合,也就是说,它的每个状态对应了2个bit的数据量,较NRZ是翻倍的。

    如果这么说还有些模糊的话,这里可以将PAM4信号类比成MLC闪存存放数据的方式。我们知道,MLC闪存的每个单元可以存放2-bit的数据,在电信号层面上它表现为4种不同的电平,每个电平之间有固定的电压间隔,主控在读取和写入的时候都按照固定的规则将数据和电信号进行转换。

    那么GDDR6X也是如此,根据NVIDIA公布出来的信息,GDDR6X有四种不同的电平信号,每个电平信号之间的电压差为250mV。

    在采用PAM4调制之后,显存系统的信号纯净度有了一个很大的提升,有图为证:


    上为GDDR6,下为GDDR6X

    在换用PAM4之后,如果继续沿用原本的16n突发读取长度,那么每次将会读取到32-bit的数据,为了保证兼容性,GDDR6X将Burst Length降回了GDDR5时代的8n,这样每次的预取数据仍然为16-bit。

    NVIDIA的黑魔法加持

    为了更好的配合和利用GDDR6X显存,NVIDIA还应用了一些自己的黑魔法技术,比如MTA(Max Transition Avoidance)编码就是其中之一。

    MTA编码是NVIDIA的专利技术,它是一项用于配合PAM4信号调制方式的技术,原理是将原本全长为16-bit的突发数据分割成两部分进行发送,以降低信号在传输过程中出现的误码、损耗等问题。

    更高的能效比

    不可否认的是,当代qy700千亿国际上的显存能耗是越来越高了,一个是运行的频率高了,另一个因素是容量大了。而GDDR6X的一大特点就是能够提供更高的能效比。

    美光提供的数据显示,同样的8颗显存,等效频率为21Gbps的GDDR6X显存的能效比跟14Gbps的GDDR6显存在每比特能耗上要低15%。要知道,在此同时GDDR6X还提供了多50%的显存带宽。

    GDDR6X产品及应用

    由于GDDR6X显存是NVIDIA和美光联手研发的,它暂时还没有被JEDEC给标准化,所以也没有第二家能够生产GDDR6X显存的内存生产商。

    目前美光提供两种GDDR6X颗粒,容量密度均为8Gb(单颗1GB),两种颗粒的区别只有频率,后缀为19的颗粒等效频率为19Gbps,后缀21的颗粒等效频率为21。很明显,在RTX 3080上出现的就是型号为MT61K256M32JE-19的颗粒,但RTX 3090的显存颗粒现在还不明朗。

    由于GDDR6X采用了完全不同的信号调制方式,所以GPU的内存控制器需要进行重新设计才能支持它,目前NVIDIA应该也只是计划只在GA102核心上做它的支持,而定位更低的GA104、GA106等核心应该都只支持GDDR6。在RTX 3070及之下的RTX 30系qy700千亿国际和未来可能的GTX 26系列qy700千亿国际上,我们看到的应该仍然是GDDR6显存。

    总结:GDDR6X可能不会很普及,但它代表了未来方向

    GDDR6X在GDDR家族中首次应用了PAM4信号调制方式,提升了信号传输的效率,能够以更低的时钟频率达成同样的等效频率。PAM4信号调制方式也并不是什么新的技术,它在高速以太网中早已经被广泛应用,而且目前正处于规划中的PCIe 6.0总线也计划将信号调制方式从NRZ切换到PAM4上去,在频率提升已经达到物理极限的时候,更高效率的信号调制方式就是新的用来提升带宽的手段了。

    由于GDDR6X和GDDR5X类似,是NVIDIA和美光合作开发的,所以短时间内我们很难看到采用GDDR6X的A卡,也很难说美光会不会将GDDR6X提交给JEDEC进行标准化。就之前GDDR5X的情况来看,GDDR6X应该不会像GDDR6那么普及,主流级别的qy700千亿国际将仍然采用GDDR6显存,而专业级的GPU则会选择有更大带宽的HBM。

    或许我们不会看到标准化的GDDR6X,但未来比GDDR6更新的标准可能会吸收GDDR6X上所使用的新信号调制方式。它可能不会很普及,但它确实是显存发展的一个未来方向。

  • ×
    热门文章
    1技嘉RTX 3080 VISION OCqy700千亿国际图赏:银白色设计、颜值拉满
    2微星Creator PS321URV显示器评测:影视创作者的好助手
    3SteelSeries赛睿发布桌面级巨型鼠标垫QcK:提供多种面积选择,服务更多玩家
    4华硕灵耀X逍遥轻薄笔记本体验:翻转现4K天地,活虎嗅EVO平台
    5首款英特尔EVO认证产品,华硕推出灵耀X系列笔记本
    6希捷发布全新Xbox Series X|S专用存储扩展卡
    7微星Creator PS321URV显示器评测:影视创作者的好助手^1
    8华硕灵耀X逍遥轻薄本体验:4K会翻转,EVO也平价^1
    已有 26 条评论,每一条合规评论都是对我们的褒奖。
  • 这些评论亮了
  • 63047838教授 09-10 21:44  加入黑名单

    内存的工作机制是用一个晶体管控制一个电容,充电时为1,放电时为0,因为存在漏电需要不断的给电容补充电压,断电则数据清空,电容理论上无充放电次数限制,所以工作过程中不会产生损耗。
    而闪存是一个栅级上串接了悬浮门(Floating Gate)的绝缘栅场效应管(MOS),写入数据就是向悬浮门注入电荷,SLC方式高电平为1,低电平为0,而MLC则将电压分成四档(11,10,01,00),TCL以此类推。
    闪存靠包裹悬浮门的绝缘层实现断电保存信息,但因为电子迁移的存在长时间断电仍然会丢失数据,悬浮门材料在多次注入电荷后,会发生电子固化或绝缘层破坏,无法再次充入电荷,既写入寿命已耗尽。
    纯手打。

    支持(36)  |   反对(1)  |   举报  |   回复

    18#

  • 游客 09-16 00:56

    游客

    醒醒,现在最新评测还是按着980TI压一个位的
    09-12 00:11
  • 支持(0)  |   反对(0)  |   举报  |   回复
  • fury x最新评测,漫威复仇者里比980ti全分辨率帧数低10%叫压着一位?张嘴就来选手别搞笑了好么。

    支持(0)  |   反对(0)  |   举报  |   回复

    26#

  • 游客 09-12 00:11

    游客

    为什么你认为带宽大就能解决爆显存呢?看看fury x现在还因为那4g显存打不过980ti呢。当初一群a炮吹带宽够大4g够用,现在他们都不敢提这张卡了。3080以后也是一个待遇,4k下显存会成 ...
    09-11 19:01
  • 支持(0)  |   反对(0)  |   举报  |   回复
  • 醒醒,现在最新评测还是按着980TI压一个位的

    支持(0)  |   反对(0)  |   举报  |   回复

    25#

  • 游客 09-11 19:01

    游客

    好文章!

    有个问题,显存容量更大是否意味着同核心下所需的显存小呢?
    之前Vega上的HBM2带宽夸张、容量不大,看下来似乎没有出现显存不够用的情况 ...
    09-11 09:09
  • 支持(0)  |   反对(0)  |   举报  |   回复
  • 为什么你认为带宽大就能解决爆显存呢?看看fury x现在还因为那4g显存打不过980ti呢。当初一群a炮吹带宽够大4g够用,现在他们都不敢提这张卡了。3080以后也是一个待遇,4k下显存会成 ...

    支持(0)  |   反对(0)  |   举报  |   回复

    24#

  • 拾人牙慧教授 09-11 16:09  加入黑名单

    游客

    好文章!

    有个问题,显存容量更大是否意味着同核心下所需的显存小呢?
    之前Vega上的HBM2带宽夸张、容量不大,看下来似乎没有出现显存不够用的情况 ...
    09-11 09:09
  • 支持(0)  |   反对(0)  |   举报  |   回复
  • 不会。
    显存容量是个硬杠杠,3D程序需要把多少数据放入显存,就会放多少,不够用的话就会占用内存,而且会迟缓。不会说显存带宽高就少放点

    支持(1)  |   反对(1)  |   举报  |   回复

    23#

  • 游客 09-11 09:09

    好文章!

    有个问题,显存容量更大是否意味着同核心下所需的显存小呢?
    之前Vega上的HBM2带宽夸张、容量不大,看下来似乎没有出现显存不够用的情况 ...

    支持(0)  |   反对(0)  |   举报  |   回复

    22#

  • 游客一代宗师 09-10 22:15  加入黑名单

    游客

    驱家又在造谣了,吹RX 6000系列也不会有HBM显存,这次应该也是GDDR6X显存
    09-10 21:59 已有2次举报
  • 支持(1)  |   反对(0)  |   举报  |   回复
  • GDDRX 镁光和nv合作的独享了很久的显存了是不会给amd使用的

    支持(2)  |   反对(0)  |   举报  |   回复

    21#

  • 游客 09-10 21:59

    驱家又在造谣了,吹RX 6000系列也不会有HBM显存,这次应该也是GDDR6X显存

    已有2次举报

    支持(1)  |   反对(0)  |   举报  |   回复

    20#

  • 游客 09-10 21:51

    游客

    该评论因举报过多,自动进入审核状态。

    打平?莫非是用嘴打平的?

    支持(0)  |   反对(0)  |   举报  |   回复

    19#

  • 游客 09-10 20:49

    1tb每秒,有点恐怖

    支持(0)  |   反对(0)  |   举报  |   回复

    17#

  • 游客一代宗师 09-10 20:32  加入黑名单

    游客

    花屏后, 老黄会不会直接甩锅给美光?
    09-10 19:58
  • 支持(0)  |   反对(0)  |   举报  |   回复
  • 应该没出现花屏,虽然还没有零售但是已经很多人偷跑在用了

    支持(2)  |   反对(0)  |   举报  |   回复

    16#

  • 游客 09-10 19:58

    花屏后, 老黄会不会直接甩锅给美光?

    支持(0)  |   反对(0)  |   举报  |   回复

    15#

  • zhaoyun980博士 09-10 19:50  加入黑名单

    就是说这只是个过渡产品

    支持(0)  |   反对(1)  |   举报  |   回复

    14#

  • 游客 09-10 19:32

    该评论因举报过多,自动进入审核状态。

    13#

  • 拾人牙慧教授 09-10 19:23  加入黑名单

    倪嘉声 博士

    信号传递方式发生改变,不是数据存储方式发生改变。
    09-10 17:46
  • 支持(3)  |   反对(0)  |   举报  |   回复
  • 明白了。非常感谢。
    文章和答疑都很好,感谢。
    文末赞赏什么时候取消掉了?

    支持(0)  |   反对(0)  |   举报  |   回复

    12#

  • yjhercules终极杀人王 09-10 18:41  加入黑名单

    该评论因举报过多,自动进入审核状态。

    11#

  • 倪嘉声博士 09-10 17:46  加入黑名单

    拾人牙慧 教授

    提个问题,易失性储存一般没有谈论它们的寿命的,易失性储存的寿命真的长到无所谓吗?
    这种2bit的读写方式,理论寿命是否会比1bit的要低?
    虽然反正都是用不坏,好奇问问。
    09-10 17:02
  • 支持(6)  |   反对(0)  |   举报  |   回复
  • 信号传递方式发生改变,不是数据存储方式发生改变。

    支持(3)  |   反对(0)  |   举报  |   回复

    10#

  • QQ23870862终极杀人王 09-10 17:37  加入黑名单

    学习了

    已有1次举报

    支持(0)  |   反对(0)  |   举报  |   回复

    9#

  • 游客 09-10 17:22

    那么是不是3080以上必须用PCIE4.0才能发挥100%?

    已有1次举报

    支持(3)  |   反对(1)  |   举报  |   回复

    8#

  • 拾人牙慧教授 09-10 17:02  加入黑名单

    提个问题,易失性储存一般没有谈论它们的寿命的,易失性储存的寿命真的长到无所谓吗?
    这种2bit的读写方式,理论寿命是否会比1bit的要低?
    虽然反正都是用不坏,好奇问问。

    支持(6)  |   反对(0)  |   举报  |   回复

    7#

  • 游客 09-10 16:53

    该评论因举报过多,自动进入审核状态。

    6#

  • 游客 09-10 16:46

    会翻车吗

    支持(1)  |   反对(0)  |   举报  |   回复

    5#

  • 游客 09-10 16:45

    农企613,256Bit-G6要干320Bit-G6X

    支持(0)  |   反对(0)  |   举报  |   回复

    4#

  • 游客 09-10 15:56

    游客

    最喜欢这种不明觉厉的科普文了
    09-10 15:51
  • 支持(3)  |   反对(0)  |   举报  |   回复
  • 科普文真好打暴了y神的脸,说什么NV用普通的显存能打败amd的笑话

    已有2次举报

    支持(6)  |   反对(2)  |   举报  |   回复

    3#

  • 游客 09-10 15:54

    这样就很好解析 NV使用GDDRX而AMD使用HBM。

    支持(1)  |   反对(0)  |   举报  |   回复

    2#

  • 游客 09-10 15:51

    最喜欢这种不明觉厉的科普文了

    支持(3)  |   反对(0)  |   举报  |   回复

    1#

  • 提示:本页有 1 个评论因未通过审核而被隐藏

    我来评论
    为你推荐
  • Radeon RX 5500 XT天梯榜首测

    发布于 2019-12-25
    收藏 | 评论(106)
  • AMD Radeon 2020驱动体验

    发布于 2019-12-25
    收藏 | 评论(50)
  • 《光环: 致远星》硬件需求测试

    发布于 2019-12-25
    收藏 | 评论(22)
  • 2019巨献:RTX 2070 SUPERqy700千亿国际横评

    发布于 2020-02-25
    收藏 | 评论(58)
  • NVIDIA RTX/GTX系列qy700千亿国际创作性能测试

    发布于 2020-03-30
    收藏 | 评论(82)
  • Radeon RX 5600 XT天梯榜首测

    发布于 2020-02-25
    收藏 | 评论(96)
  • GTX 1650 SUPER天梯榜首测

    发布于 2019-12-25
    收藏 | 评论(105)
  • Radeon RX 590 GME天梯榜首测

    发布于 2020-03-30
    收藏 | 评论(59)
  • 《迸发2》硬件需求测试

    发布于 2019-10-28
    收藏 | 评论(13)