E X P
本文约 2120 字,14 张图表,正拼命加载…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    Windows 10 Version 2004中,开发团队给系统新增了一个名为“硬件加速GPU计划”的选项,它隐藏在“显示设置-图形设置”中,作为一个实验性的选项提供。对于这个选项,微软官方在之前并没有做太多的解释,我们也就是道听途说认为它可以减低显示延迟什么什么的。在上个月末,终于有官方人员对这个选项进行了完整的解释,本文就根据官方的这篇博文,讲讲这个全新的硬件加速GPU计划选项的具体工作原理和作用,并整合了多家媒体的测试数据,看看它起的作用大小。

    “硬件加速GPU计划”

    官方把Hardware-accelerated GPU scheduling这个词翻译成了硬件加速GPU计划,实际上在这里scheduling翻成“调度”能够让更多人明白它的意思,这也是比较有微软风味的翻译了。

    回归正题,要说到GPU调度管理,我们就先要了解一下WDDM GPU调度器是什么。

    WDDM GPU调度器与命令缓冲队列

    从NT 6开始,微软给Windows引入了一套新的显示驱动模型,也就是我们现在所熟知的Windows Display Driver Model,简称WDDM。在WDDM出现之前,应用程序可以直接把任务提交到GPU,当时系统只有一个全局的任务队列,严格按照先到先执行的原则进行任务的调度。鉴于当时用到GPU的场景基本上就是全屏游戏或者专业用途的渲染什么的,这种方案也没出什么问题,被沿用了很多年。


    现在很多程序都会调用GPU

    到了应用程序开始普遍利用GPU加速的年代,比如说Windows要直接用GPU加速整个UI界面的渲染了,那么再用这个全局任务队列就会有问题,比如渲染系统界面的任务前面排了一个其他程序提交的任务,那么GPU会先处理掉那个任务再回头来处理系统的需求,这会造成整个系统UI的卡顿。为了妥善地安排GPU工作的优先级,势必需要一个新的任务调度器,由它负责安排GPU任务的工作优先级。

    那么WDDM就引入了那么一个任务调度器,它以高优先级线程的形式一直运行在CPU上,负责协调、优先处理和调度各种应用程序提交的工作。从Vista上面的WDDM 1.0到Windows 10 Version 2004的WDDM 2.7,官方一直都在加强这个调度器的功能。但这种管理方式存在有一定的限制,主要体现在提交会有额外开销和任务达到GPU有一定的延迟时间,不过这些限制在实际中都被传统图形应用的渲染缓冲队列给掩盖了。缓冲用来存放提前准备好的渲染命令等等内容,在GPU渲染当前帧的时候,CPU已经在准备下一帧、下下帧乃至之后的更多帧数了。这种方式能够保证CPU与GPU之间的良好执行并行性,也可降低整体的性能开销,是现在很常见的GPU调用方式。同时为了降低频率提交渲染命令带来的额外性能开销,一般应用程序会提前准备好多帧的内容一起发送到队列中。这里产生了问题,缓冲的帧数越多,用户能够感受到的延迟越高。


    题外话,NVIDIA和AMD两家在去年都已经在驱动层面提供了对缓冲队列深度的控制,通过降低缓冲队列的帧数来实现降低延迟这一目的。

    但如果想减少缓冲队列的深度来降低延迟,又会造成提交开销增加,影响到性能。这两者之间是一个权衡关系,程序可能以更高的频率每次提交更少的帧数来降低延迟,又可能以较低的频率每次提交更多的帧数来减少额外的调度、提交开销。所以,微软决定修改其显示驱动模型的基础架构,引入了“硬件加速GPU计划”。

    把任务调度交给专用硬件

    Windows 10 Version 2004中引入的新选项就是允许系统将绝大多数的调度任务交由GPU专有的硬件调度器去做,Windows将继续控制程序调用GPU的优先级,但高频任务将会交由GPU的调度处理器进行管理,它负责各种GPU引擎的量子管理和上下文切换。

    在NVIDIA的官方说法中,新的选项就是允许GPU直接管理它自有的内存,也就是显存,在此之前,显存是交给系统来管理的。

    要启用这个新调度方式有两个先决条件,一个是需要硬件支持:它需要GPU自身有专有的处理调度任务的硬件模块,另一个是驱动支持:系统需要一个符合WDDM 2.7标准的显示驱动。当你的驱动和硬件都支持时,系统设置里才会出现这一选项。另外,引入新的调度方式对驱动模型有一个重大且根本性的改变,在某些时候、某些场景下它可能会产生不可知的效果,因此微软将其作为一个实验性的选项,默认情况下是关闭掉的。目前开发团队还在比较两种调度器之间的性能差异,同时也在监控新调度器的可靠性,未来这个选项可能会在支持的硬件上变为默认开启状态。

    目前支持这一特性的GPU有NVIDIA的Pascal GPU和Turing GPU、AMD的RDNA GPU,Intel那边的情况不明。

    实际测试:对高端平台影响不大

    好了,说了那么多,我们还是来看看这项功能在实际中的表现吧,我们找来了Tom's Hardware和Wccftech两家媒体的测试数据(以下图片来自于Tom's HardwareWccftech)。

    Tom's Hardware这边使用了三套测试平台,分别是Core i9-9900K+RTX 2080 Ti、Ryzen 9 3900X+RTX 2080 Ti和Core i9-9900K+GTX 1050。从五款游戏的测试结果来看,基本上没有用户可感知的区别。

    Wccftech选择了Core i9-9900K+RTX 2080 Ti/GTX 1650 SUPER这样两套平台,在RTX 2080 Ti上面启用硬件调度的性能变化并不明显,但是在GTX 1650 SUPER这样一张主流级qy700千亿国际上面则是出现了明显的提升。其原因,如果按照NVIDIA方面的说法来解释,那就是由GPU直接管理显存在效率上带来了一定的提升。也许,这项功能会为很多主流级平台带来可观的免费性能增幅,而对高端平台来说,影响是微乎其微的。

    总结:仍需时日完善的好技术

    所以,“硬件加速GPU计划”实质上是一项对Windows图形架构影响较大的新技术,它需要新硬件和新驱动的支持才能够实现,能够为平台带来一定的性能提升。但目前它仍然处于测试状态,GPU厂对它的支持仍然算是刚刚可以用的状态,还需要官方进一步的优化和完善它。这也是微软为次世代图形应用对系统做出的改变,为了尽可能的降低延迟,让系统跟上时代的发展。它是一项好技术,但仍然还有很长的一段路要走。

  • ×
    热门文章
    1美国封杀微信之后,苹果的iPhone 12系列或将再受打击
    2Thermaltake ThoughPower PF1 850W电源图赏:纯粹的高性能PC电源
    3传言NVIDIA会在9月9日发布安培,旗舰qy700千亿国际有24GB显存
    4AMD也有自己的大小核构想,具体实现可能自成一派
    5微软新一代主机手柄已在零售渠道出现,确认将会有Xbox Series S
    6无灯也卖499元?雷蛇推出不花里胡哨的瞬甲虫鼠标垫
    7受疫情影响,美国网络摄像头设备销量暴涨179%
    8微软召唤了一群MVP,可能开一个关于Surface Duo的简介会
    9Windows打印机漏洞未被完全修复,攻击者可以通过Splooer入侵。
    已有 16 条评论,每一条合规评论都是对我们的褒奖。
  • 游客 07-08 20:46

    我十分怀疑他们怎么测出来1650Sqy700千亿国际有这么明显的提升的?我这边,台式机i9-9900KF+2080Ti,笔记本R7 4800H+GTX1650,分别2K和1080P跑极限竞速地平线4自带的性能测试,GPU加速开不开 ...

    支持(0)  |   反对(0)  |   举报  |   回复

    19#

  • 游客 07-07 19:45

    scheduling: 排程、调度
    计划是什么鬼……

    支持(1)  |   反对(0)  |   举报  |   回复

    18#

  • 游客 07-05 22:30

    更期待新一代GPU虚拟化。老的RemoteFX基本上被放弃了。沙盒和WSL2都有新的GPU虚拟化,如果给uwp的游戏开放,就很不错

    支持(1)  |   反对(0)  |   举报  |   回复

    17#

  • 游客 07-05 21:01

    Intel要7代以上的核显,也就是HD630.

    支持(0)  |   反对(0)  |   举报  |   回复

    16#

  • 超能康猩猩教授 07-05 12:57  加入黑名单

    游客

    农企有点过分,GCN直接抛弃
    07-04 16:39 已有1次举报
  • 支持(7)  |   反对(1)  |   举报  |   回复
  • GCN也在支持计划中了,不过我记得最低也得是R3/5/7/X系列的,HD前缀的GCN好像不在计划中,至于N卡那边,按道理麦克斯韦应该也能支持,就看老黄愿不愿意做驱动了。

    支持(2)  |   反对(0)  |   举报  |   回复

    14#

  • zhaoyun980研究生 07-05 10:27  加入黑名单

    软件和硬件的协调问题

    支持(0)  |   反对(0)  |   举报  |   回复

    13#

  • 游客 07-05 08:24

    这个翻译配合评论区太尬了

    支持(3)  |   反对(0)  |   举报  |   回复

    12#

  • 游客 07-04 21:09

    你们真是太万恶了 Y神 又被关小黑屋了 我都没看见他说什么

    支持(6)  |   反对(0)  |   举报  |   回复

    10#

  • QQ23870862终极杀人王 07-04 19:18  加入黑名单

    看不明白

    已有4次举报

    支持(0)  |   反对(4)  |   举报  |   回复

    8#

  • 游客 07-04 16:39

    onelite 教授

    该评论因举报过多,自动进入审核状态。

    农企有点过分,GCN直接抛弃

    已有1次举报

    支持(7)  |   反对(1)  |   举报  |   回复

    7#

  • yjhercules终极杀人王 07-04 16:35  加入黑名单

    该评论因举报过多,自动进入审核状态。

    6#

  • 倪嘉声编辑 07-04 13:48  加入黑名单

    拾人牙慧 教授

    这个硬件加速GPU计划,能解决安卓模拟器调用qy700千亿国际效率低下的问题吗?
    已经很高配的台式机,玩安卓模拟器还是卡成PPT,该调好的设置都调好了,就是卡顿。
    07-04 13:33
  • 支持(0)  |   反对(0)  |   举报  |   回复
  • 不能。Android模拟器涉及到很多东西,效率不高是真正的

    支持(3)  |   反对(0)  |   举报  |   回复

    5#

  • 终末之虚梦研究生 07-04 13:46  加入黑名单

    onelite 教授

    该评论因举报过多,自动进入审核状态。

    为何不一视同仁?Vega也不支持WDDM 2.7啊。要批评就该一起批评,而不是阴谋论

    已有1次举报

    支持(10)  |   反对(0)  |   举报  |   回复

    4#

  • 拾人牙慧教授 07-04 13:33  加入黑名单

    这个硬件加速GPU计划,能解决安卓模拟器调用qy700千亿国际效率低下的问题吗?
    已经很高配的台式机,玩安卓模拟器还是卡成PPT,该调好的设置都调好了,就是卡顿。

    支持(0)  |   反对(0)  |   举报  |   回复

    3#

  • 拾人牙慧教授 07-04 13:11  加入黑名单

    请问怎么在有问有答里提问呢?

    支持(2)  |   反对(0)  |   举报  |   回复

    2#

  • onelite教授 07-04 12:39  加入黑名单

    该评论因举报过多,自动进入审核状态。

    1#

  • 提示:本页有 2 个评论因未通过审核而被隐藏

    我来评论
    为你推荐
  • GTX 1650 SUPER天梯榜首测

    发布于 2019-12-25
    收藏 | 评论(105)
  • 《我的世界》硬件需求测试

    发布于 2020-07-21
    收藏 | 评论(19)
  • Radeon RX 5500 XT天梯榜首测

    发布于 2019-12-25
    收藏 | 评论(106)
  • 《战争机器5》硬件需求评测

    发布于 2019-09-24
    收藏 | 评论(22)
  • 《迸发2》硬件需求测试

    发布于 2019-10-28
    收藏 | 评论(13)
  • 盈通RX 5700 XT 樱瞳qy700千亿国际评测

    发布于 2019-12-25
    收藏 | 评论(54)
  • 《Control》硬件需求测试:光追新世界

    发布于 2019-09-04
    收藏 | 评论(29)
  • Radeon RX 590 GME天梯榜首测

    发布于 2020-03-30
    收藏 | 评论(59)
  • 2K/144Hz显示器该搭配什么qy700千亿国际?

    发布于 2019-09-24
    收藏 | 评论(39)