E X P
本文约 2930 字,16 张图表,正拼命加载…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    今天不管对DIY硬件业界还是对游戏业界来说,都是个大日子,因为NVIDIA发布了新一代在性能上有巨大飞跃的RTX 30系qy700千亿国际。首批的三张qy700千亿国际在性能方面可谓是有着非常大的提升,就算其中定位最低的RTX 3070在官方宣传口径中都能有超过上一代旗舰卡RTX 2080 Ti的性能。那么,RTX 30系qy700千亿国际是如何做到如此巨大的性能提升幅度的呢?本文就基于官方目前给出的信息对RTX 30系qy700千亿国际的核心,也就是代号为Ampere的GPU进行简要的分析,由于官方尚未给出新一代qy700千亿国际的白皮书,故本文只能挖掘到较为浅层的一些信息。

    相关文章:
    NVIDIA正式发布新一代GeForce RTX 30系列qy700千亿国际:性能爆炸,价格惊喜
    与RTX 30系qy700千亿国际一同登场的各种黑科技汇总:AI技术已经来到我们身边
    [视频] 5分钟看完NVIDIA RTX 30系列GPU发布会!
    [视频] 初谈刚发布的NVIDIA RTX 30系列qy700千亿国际!7家AIC厂商聊他们的看法!

    Turing架构是NVIDIA的初代RTX架构,它首次引入了RT Core,并升级了从Volta架构开始引入的Tensor Core。

    它的意义在于将整个GPU的处理管线分成多个部分,早前的GPU只需要全力渲染画面即可,而在引入实时光线追踪特效之后,GPU中的处理核心需要分心去算光线追踪特效,偏偏这部分又非常吃算力,会让传统的GPU浪费非常多的算力。

    于是NVIDIA想到为实时光线追踪引入独立的硬件处理管线,也就是RT Core。但在开启实时光线追踪的情况下,单靠RT Core在那边加速仍然没法达成高帧数的目标,所以NVIDIA研发了DLSS技术,也就是利用机器学习,通过AI升频的方式将低分辨率的游戏图像实时处理成高分辨率的图像输出。因为降低了实际的渲染分辨率,所以大幅减轻了GPU的计算压力,从而达成开启实时光追下的流畅游戏。

    但是,Turingqy700千亿国际的一大问题就是计算规模不够大,老黄在发布上也很坦诚的说,开了光追的Turingqy700千亿国际表现和没开光追的Pascal差不太多(从图上甚至可以看到GTX 1080 Ti在非光追情况下的表现要优于光追场景下的RTX 2080 Super)。但是Turing GPU的工艺已经不允许NVIDIA往里面塞入更多的计算单元了,那么,是时候换工艺了。

    与A100加速卡上那枚使用台积电N7工艺的GA100芯片不同的是,NVIDIA选择和三星合作,定制了基于三星8nm工艺的制程,称为Samsung 8N(N for NVIDIA)。在面积最大的GA102芯片中,NVIDIA塞入了280亿个晶体管,这个数字是TU102的1.5倍,但仍然比面向计算用途的GA100少很多(542亿)。

    这多出来的1.5倍晶体管主要被用在加倍FP32单元上,从NVIDIA官网上的对比表我们即可看到这一明显的区别点。

    以往在NVIDIA的GPU中,一个CUDA Core对应一个FP32计算单元,在Turing GPU上面,NVIDIA加入了独立的整数计算单元,它与传统FP32计算单元的比例是1:1,到了Ampere上,因为对算力有非常高的需求,NVIDIA直接选择把FP32单元的数量暴力翻倍。并且官方并没有采用一个CUDA Core对应两个FP32单元的计数方式,仍然保留了1:1的算法,所以我们看到了CUDA核心数量暴涨的一代qy700千亿国际,下表对几代同级qy700千亿国际的CUDA核心数量进行了对比:

    注:Ampereqy700千亿国际的INT单元数量暂时按照1:2的比例计算。

    从上表中我们可以感受到RTX 30qy700千亿国际在计算规模上的暴增,不过这只是它性能增幅来源的一个部分。NVIDIA还引入了第二代RT Core和第三代Tensor Core。新的RT Core在处理光线追踪相关的计算时,可达到初代RT Core的1.7x效率,而GA100的同款Tensor Core则带来了2.7x的AI性能提升。

    另外不得不提的还有新的显存。RTX 3080和RTX 3090都使用了来自于美光的GDDR6X显存,在显存带宽上逼近1TB/s的大关。这多个方面拼合到一起,让RTX 30系列qy700千亿国际拥有了暴涨的性能表现。


    第二代RT Core让RTX 30qy700千亿国际在越复杂的实时光追场景下有更高的性能增幅

    总的来看,Ampere GPU在能耗比上达成了一个1.9x的进步,在半导体制程提升日益困难的今天,这个进步幅度已经算是不小了。但是从上图我们也需要注意到,Ampereqy700千亿国际在功耗上将会比Turingqy700千亿国际去到更高的地步。

    再来详细谈一谈这次发布的三张qy700千亿国际。

    首先是RTX 3080,官方将其作为旗舰卡,而不是RTX 3090。官方标称它有2倍于RTX 2080的性能。

    就算单看RTX 3080的CUDA核心数量,我也会信NVIDIA的说法,毕竟它有着三倍于RTX 2080的CUDA核心数量。但是这也带来了一个问题,三倍于RTX 2080的CUDA核心数量为什么只能带来两倍的性能?这个问题只能等到官方公布qy700千亿国际白皮书的时候才能知晓了。

    RTX 3080香不香?当然了,同样的起售价给你两倍的性能,能不让人高喊“NVIDIA YES”吗?但各位准备买新qy700千亿国际的朋友需要注意两个问题,一个是供电,另一个是新卡的体积。

    三星的8nm制程实际上是10nm的改良版,给GPU带来的省电效果是比从TSMC N16跨越到N7差得远了。庞大的GPU规模带来的必然是能耗和发热的大幅增加,公版的RTX 3080的标称TGP达到了320W,同时其GPU最高限温被抬高到了93℃。原本GPU的瞬时功耗就要比标称的TGP高上不少,现在基数都高了很多,那瞬时功耗还不得上天?这就给电源带来了很大的挑战,首先是瓦数要高,750W可能只能算是底线,上850W会更好,另外是电源的品质要好,能够应付新qy700千亿国际的超高瞬时功率。那么功耗高了,发热量当然也会上去,这带来了第二个问题,为了即时散去热量,qy700千亿国际厂商需要升级散热器,增大鳍片、加多风扇叶片数量这些都是常规操作了,自然会带来散热器体积的增加,进而增加了qy700千亿国际整体的体积。官方给公版RTX 3080的标称厚度是双槽,不过就我们手上的qy700千亿国际和今晚AIC们的发布来看,新qy700千亿国际占到三槽的可以说是比比皆是。

    再来说说大家都爱的RTX 3070。如果说RTX 2070是一代坑爹卡的话,那么这次的RTX 3070可以说是回归系列定位初心的一张卡。让我们回想一下,当年的各种x70qy700千亿国际提供的是什么?是次旗舰级别的性能表现和平近易人的价格,最经典的就是GTX 970和GTX 1070 Ti了。那么这次的RTX 3070在性能上虽然仍被拉开了一个身位,次旗舰级别的性能表现无从谈起,但如果进行代际之间比较的话,它是比RTX 2080 Ti略强一点点的,换句话说,你可以用4000块钱买到一张RTX 2080 Ti级别的qy700千亿国际,想想之前RTX 2080 Ti卖到多少吧。唯一的一个问题是,它仍然只有8GB的显存,在未来的4K游戏普及时代,这点显存可能会出现不够用的情况。

    再说说这次的卡皇RTX 3090。老黄用了“BFGPU”这个自造缩写来描述这款qy700千亿国际。它瞄准的,已经不再是简单的4K游戏,而是更高层次的8K游戏,而且一做,就要做到8K60。当然,这个目标是要通过DLSS技术来实现的,但也足以让人们惊叹了。24GB的显存也让它很适合用来当成一张创作卡,或者说,准专业卡。 最后,¥11999的售价看上去不怎么亲民,但想想上一代Titan RTX的定价……足够让人发自肺腑的说一句,老黄良心啊。

    当然,老黄是不是真的良心,我们抱持怀疑态度,因为这次的RTX 30系qy700千亿国际采取如此有性价比的定价方案可能是受到AMD方面的压力了,RDNA 2可能真的不是省油的灯,所以NVIDIA需要通过提前布局市场来防范对手。

    好了,以上就是我个人对Ampere架构和首发游戏卡的快速分析,如有看法可以在评论区讨论。

  • ×
    热门文章
    1技嘉RTX 3080 VISION OCqy700千亿国际图赏:银白色设计、颜值拉满
    2微星Creator PS321URV显示器评测:影视创作者的好助手
    3SteelSeries赛睿发布桌面级巨型鼠标垫QcK:提供多种面积选择,服务更多玩家
    4华硕灵耀X逍遥轻薄笔记本体验:翻转现4K天地,活虎嗅EVO平台
    5首款英特尔EVO认证产品,华硕推出灵耀X系列笔记本
    6希捷发布全新Xbox Series X|S专用存储扩展卡
    7微星Creator PS321URV显示器评测:影视创作者的好助手^1
    8华硕灵耀X逍遥轻薄本体验:4K会翻转,EVO也平价^1
    已有 155 条评论,每一条合规评论都是对我们的褒奖。
  • 这些评论亮了
  • 游客 09-02 19:24

    yjhercules你好!我是天津市精神疾病健康研究中心的主治医生,主攻脑残方向的研究与治疗。我院领导看到你的发表的评论以后高度重视你的情况,特派我来帮你摆脱病魔的困扰。希望你相信医生,配合我们工作,精神疾病可防可控可治,你要树立起坚强的信心,我们一定会使你走出阴影,过上正常人的生活。

    已有8次举报

    支持(71)  |   反对(4)  |   举报  |   回复

  • 清风道士学前班 09-16 16:12  加入黑名单

    坐等4060秒杀3080…………

    支持(0)  |   反对(0)  |   举报  |   回复

  • 游客 09-11 13:12

    游客

    讨论的这么激烈,看来大家都很有钱啊,羡慕死了,我还是等着3060的消息吧
    09-10 09:43
  • 支持(4)  |   反对(0)  |   举报  |   回复
  • 看来你也有钱啊 我们只有唾沫星子的钱 你到能买3060了 你个龟孙 看不起云玩家?

    已有1次举报

    支持(0)  |   反对(0)  |   举报  |   回复

  • 游客 09-10 09:43

    讨论的这么激烈,看来大家都很有钱啊,羡慕死了,我还是等着3060的消息吧

    支持(4)  |   反对(0)  |   举报  |   回复

  • 游客 09-04 22:51

    cnwjlb2019 教授

    该评论因举报过多,自动进入审核状态。

    别xjb爆主机圈大腿引战了

    支持(2)  |   反对(0)  |   举报  |   回复

  • 游客 09-04 22:30

    现在近六十了,不玩游戏 gt610够用 性能过剩

    支持(0)  |   反对(0)  |   举报  |   回复

  • 游客 09-04 15:46

    该评论因举报过多,自动进入审核状态。

  • cjgbd高中生 09-04 11:07  加入黑名单

    游客

    从头到尾都没提过任何单精度浮点能力,只说了光追涨幅,其实整体性能依然是个未知数
    09-03 09:34 已有2次举报
  • 支持(5)  |   反对(8)  |   举报  |   回复
  • 我如果没看错的话,发布会说的是2080super的着色器性能是11T,而3080的着色器是30T

    已有1次举报

    支持(2)  |   反对(2)  |   举报  |   回复

  • 游客 09-04 00:37

    游客

    从头到尾都没提过任何单精度浮点能力,只说了光追涨幅,其实整体性能依然是个未知数
    09-03 09:34 已有2次举报
  • 支持(5)  |   反对(8)  |   举报  |   回复
  • 单精度浮点是最不值得说的,你看sp数量的增幅就知道了
    反倒是效率比较让人担心,像当年kepler,780ti比680的sp数接近翻倍,性能只提升50% ...

    支持(4)  |   反对(0)  |   举报  |   回复

  • 游客 09-03 19:46

    游客

    不会吧不会吧 今天难得用下匿名就成了别人啦?搜下豿这个用字哪个号用得多。。。啧啧啧
    09-02 16:57
  • 支持(0)  |   反对(1)  |   举报  |   回复
  • 小号多就是好啊,可以随便切换角色,一会儿装客观装高玩,一会儿做满口污言秽语的暴民

    支持(3)  |   反对(0)  |   举报  |   回复

  • yjhercules终极杀人王 09-03 13:46  加入黑名单

    该评论因举报过多,自动进入审核状态。

  • 游客 09-03 12:57

    vigo93 教授

    该评论因举报过多,自动进入审核状态。

    上帝真是太残忍了,居然忘记给你长眼睛了

    已有1次举报

    支持(3)  |   反对(0)  |   举报  |   回复

  • vigo93教授 09-03 11:50  加入黑名单

    该评论因举报过多,自动进入审核状态。

  • 游客 09-03 10:14

    游客

    我认为4k游戏,3070会受到显存影响,真玩4K还得买3080,或者等高显存版本的3070(super or ti)
    09-03 09:51 已有1次举报
  • 支持(1)  |   反对(1)  |   举报  |   回复
  • 3070的定位本来就是2K游戏好不,玩4K自然80系列起步

    已有1次举报

    支持(2)  |   反对(0)  |   举报  |   回复

  • 游客 09-03 09:51

    游客

    自己看吧 只有个别4k游戏80ti 80s才有30%差距 平均也就20% 老黄ppt真的不能信 到时看评测呗 真有2080ti性能你叫那些玩家怎么想?
    09-02 18:27 已有7次举报
  • 支持(2)  |   反对(5)  |   举报  |   回复
  • 我认为4k游戏,3070会受到显存影响,真玩4K还得买3080,或者等高显存版本的3070(super or ti)

    已有1次举报

    支持(1)  |   反对(1)  |   举报  |   回复

  • 游客 09-03 09:49

    QQ23870862 终极杀人王

    该评论因举报过多,自动进入审核状态。

    你又定义现代人了

    已有1次举报

    支持(7)  |   反对(0)  |   举报  |   回复

  • 游客 09-03 09:46

    为什么高端卡用三星8nm马甲工艺啊?

    已有1次举报

    支持(2)  |   反对(1)  |   举报  |   回复

  • 游客 09-03 09:34

    从头到尾都没提过任何单精度浮点能力,只说了光追涨幅,其实整体性能依然是个未知数

    已有2次举报

    支持(5)  |   反对(8)  |   举报  |   回复

  • 游客 09-03 08:56

    游客

    不会吧不会吧 今天难得用下匿名就成了别人啦?搜下豿这个用字哪个号用得多。。。啧啧啧
    09-02 16:57
  • 支持(0)  |   反对(1)  |   举报  |   回复
  • 你重新定义了无耻这个字

    支持(0)  |   反对(0)  |   举报  |   回复

  • 游客 09-03 08:52

    游客

    不会吧不会吧 今天难得用下匿名就成了别人啦?搜下豿这个用字哪个号用得多。。。啧啧啧
    09-02 16:57
  • 支持(0)  |   反对(1)  |   举报  |   回复
  • 还在装,尾巴被踩到了吧,哈哈

    支持(0)  |   反对(0)  |   举报  |   回复

  • 游客 09-02 23:19

    roshad 高中生

    你和老光头就是镇站之宝,不懂为什么大家要举报你俩.
    09-02 22:52
  • 支持(6)  |   反对(0)  |   举报  |   回复
  • 现在要加上一个cnwjlb2019,这家伙以前评论区装客观,今天终于按耐不住摘下面具胡说八道了

    支持(5)  |   反对(0)  |   举报  |   回复

  • roshad高中生 09-02 22:52  加入黑名单

    yjhercules 终极杀人王

    该评论因举报过多,自动进入审核状态。

    你和老光头就是镇站之宝,不懂为什么大家要举报你俩.

    支持(6)  |   反对(0)  |   举报  |   回复

  • yjhercules终极杀人王 09-02 20:43  加入黑名单

    该评论因举报过多,自动进入审核状态。

  • 超能康猩猩教授 09-02 20:32  加入黑名单

    超能康猩猩 教授

    差不多就是这个意思,其实30系的SP就跟CPU开超线程一样,实际提升大概有30~40%,把30系列的SP数量除以2再加上“超线程”的提升,以及频率的提升,就可以得出一个接近目前透露的实际游戏提升的幅度。
    09-02 20:28
  • 支持(4)  |   反对(0)  |   举报  |   回复
  • 说漏了,是可以得出对比20系的提升幅度

    支持(2)  |   反对(0)  |   举报  |   回复

  • 超能康猩猩教授 09-02 20:28  加入黑名单

    凭栏听雨声 博士

    我来解答关于小编提到的为什么3080三倍CUDA数量于2080却在官方PPT里只有两倍提升
    外媒已有评测数据,3080在实际游戏中相比2080平均提升幅度在70-80%,远达不到CUDA数量对应的水准?是不是有些似曾相识?没错,Kepler相比Fermi正是CUDA翻了三倍但实际提升远远达不到相应幅度,真正原因在于仲裁机构没有得到加强,Ampere相比Turing只是单纯翻倍了FP32数量,由每SM单元64个翻倍到128个,但前端仲裁却和2080Ti一样都是68个(RT Core和Tensor Core数量也和2080Ti相同只是改进效率),这就导致了大量CUDA运算资源冗余,造成实际游戏无法发挥这么多CUDA的真正实力,而宣称的30TFlops也只是在理论测试中才能达到的,因为理论计算不需要依赖过多仲裁,但游戏不同
    既Kepler之后NV又一次走上了重计算轻仲裁的老路,但是有理由相信Hopper架构会大幅强化仲裁,FP32将恢复为每SM 64个,这样RT和TS单元数量翻倍,使得4080有望在CUDA数量没有大幅增长的情况下性能依旧吊打3080,同时光追和DLSS性能暴增
    09-02 15:56
  • 支持(11)  |   反对(0)  |   举报  |   回复
  • 差不多就是这个意思,其实30系的SP就跟CPU开超线程一样,实际提升大概有30~40%,把30系列的SP数量除以2再加上“超线程”的提升,以及频率的提升,就可以得出一个接近目前透露的实际游戏提升的幅度。

    支持(4)  |   反对(0)  |   举报  |   回复

  • zhaoyun980博士 09-02 20:24  加入黑名单

    3070不是应该和2070S对比吗?保不准以后也来个3070S?

    支持(0)  |   反对(0)  |   举报  |   回复

  • 波利斯博士 09-02 20:13  加入黑名单

    cnwjlb2019 教授

    该评论因举报过多,自动进入审核状态。

    呵呵。

    支持(1)  |   反对(0)  |   举报  |   回复

  • zhaoyun980博士 09-02 20:12  加入黑名单

    2070S用户哭晕在厕所

    支持(1)  |   反对(0)  |   举报  |   回复

  • QQ23870862终极杀人王 09-02 20:00  加入黑名单

    该评论因举报过多,自动进入审核状态。

  • 凭栏听雨声博士 09-02 19:52  加入黑名单

    游客

    自己看吧 只有个别4k游戏80ti 80s才有30%差距 平均也就20% 老黄ppt真的不能信 到时看评测呗 真有2080ti性能你叫那些玩家怎么想?
    09-02 18:27 已有7次举报
  • 支持(2)  |   反对(5)  |   举报  |   回复
  • 3070有2080ti的性能很奇怪吗,1070持平980ti的时候你让那些之前买了980ti的人怎么想?还能怎么想

    支持(7)  |   反对(0)  |   举报  |   回复

  • 提示:本页有 4 个评论因未通过审核而被隐藏

    加载更多评论

    我来评论
    为你推荐
  • 《迸发2》硬件需求测试

    发布于 2019-10-28
    收藏 | 评论(13)
  • NVIDIA RTX/GTX系列qy700千亿国际创作性能测试

    发布于 2020-03-30
    收藏 | 评论(82)
  • Radeon RX 590 GME天梯榜首测

    发布于 2020-03-30
    收藏 | 评论(59)
  • 《我的世界》硬件需求测试

    发布于 2020-07-21
    收藏 | 评论(19)
  • Radeon RX 5600 XT天梯榜首测

    发布于 2020-02-25
    收藏 | 评论(96)
  • 超能课堂:数字视频编码的发展历程

    发布于 2020-03-30
    收藏 | 评论(23)
  • 盈通RX 5700 XT 樱瞳qy700千亿国际评测

    发布于 2019-12-25
    收藏 | 评论(55)
  • 2019巨献:RTX 2070 SUPERqy700千亿国际横评

    发布于 2020-02-25
    收藏 | 评论(58)
  • Radeon RX 5500 XT天梯榜首测

    发布于 2019-12-25
    收藏 | 评论(106)