作为GPU皇冠上的明珠,实时光线追踪技术近年来得到了迅速发展。
然而并不是所有的光线追踪体验都是一样的,正如GPU IP供应商Imagination所说,光线追踪技术可以细分为很多层级,其中第一级光线追踪技术通过软件实现,CPU占用资源较高。第二级光线追踪技术是利用硬件处理光和或者三角形碰撞,从而节省了CPU资源,目前典型的桌面显卡都是采用了这项技术。第三级光线追踪技术开始,就需要支持BVH回溯。BVH是bounding volume hierarchy,这是一种用来管理3D场景中物体的方法。这部分是目前渲染器中最困难的部分,但是可以是渲染器更加高效。第四级光线追踪技术除了光和自动测试的回溯之外,还需要相同光线上的光数统一计算,用统一的指令运行。而第五级技术则需要支持BVH builder,目前作为公司的储备技术。
高级光线追踪技术需要更新的硬件
如上图所述,Imagination认为,从CXT GPU IP开始,光线追踪技术就已经进入到第四级。
日前,Imagination宣布推出IMG DXT系列GPU,将移动设备的光追体验带入到了新阶段。尤其是如今,手机性能越来越高,在手机上玩3A大作已经不再是一种幻象。由此,玩家越来越需要沉浸且流畅的体验、真实的画面、以及更小的发热及更长的待机功耗,所有这些都对GPU有了全新的要求。
总体而言,这款GPU可以从节省面积的0.5 RAC(光线加速集群)配置扩展到高性能的4 RAC设计,涵盖从混合实现方案中的简单阴影到3A大作中的高级光追画面等各类应用。
“通过DXT,可以让光线追踪技术可以尽快铺开,哪怕只有0.5个RAC,也可以快速覆盖市场,从而让真正的内容开发者愿意去进行光线追踪相关开发。”Imagination首席营销官David Harold说道。由于如今手机的光线追踪大部分还是软件实现的,因此无论是资源占用还是功耗,都还不能商用化。
同时,为了快速实现光追技术,Imagination同行业、客户以及合作伙伴,包括手机厂商和游戏厂商共同合作,通过推出PVR2等工具,简单部署光线追踪技术。
DXT详解
旗舰产品DXT-72-2304能够提供超高端移动设备所需的性能,具有72 GTexels/s和2.5 TFLOP FP32算力。与上一代产品相比,其最大单核性能提升了50%。DXT核的单位面积性能密度比IMG CXT GPU高出20%,同时大幅降低了功耗。
如图所示,在可配置内核上,最大的单核配置从CXT-64-2048升级到DXT-96-3072,单核性能提高了50%。并且拥有可选择的光线追踪RAC。
DXT目前包括三个系列。分别面向主流、高端以及旗舰型,提供不同算力、像素填充率以及光线追踪RAC等。
如图所示,不同公司的光线追踪技术有着明显差别,那么为什么Imagination的DXT系列可以一枝独秀?官方透露了几个黑科技。
支持Vulkan的片段着色率(FSR)技术
片段着色率(Fragment Shading Rate,FSR)(在DirectX中也称为可变着色率VRS)是一种可以提高图像表现并降低功耗的技术。FSR允许共享着色器程序的执行结果跨多个片段。因此,不是1:1执行着色器程序,这意味着一个着色器可以覆盖更多像素的区域,从而实现了更高的性能、更低的带宽和更低的功耗。
Imagination表示,开发者可以控制FSR的使用力度,最极端的情况下甚至可以对一个4x4的片段区域只执行一次着色器代码,这意味着只需1/16的资源,从而使工作负载减少近94%。
FSR可以在用户不太注意的地方复用,从而节约资源。另外,FSR功能也适用于光线跟踪。因为着色器调用需要发射的光线更少,因此提交的光线更少并且结果在较大的像素区域上被重新使用。
如图所示,我们可以看到在周边区域,可以运用更多的4X4单元统一着色,而在需要光线追踪的地方,应选择更细致的着色。而缩减光线数量,基本在图像表现上看不出差异。
2D双速率纹理处理
许多先进的游戏依靠大量纹理取样实现高级过滤效果。IMG DXT GPU的纹理处理单元(TPU)内置一个已获得专利的创新特殊模式,能够为这些后处理效果创建一条“快速通道”,在使双线性滤波性能几乎翻倍的同时,最大程度地减少面积的增加并降低整体功耗。该GPU不但可以加速诸如游戏后处理和计算图像学应用中的滤镜效果;更高的吞吐量也有助于实现更快、更低功耗的降噪算法,提高光追画面的质量。
数据显示,许多游戏花费大量资源执行后处理算法,以实现景深、光华和模糊等效果。最在这些后处理过程中,纹理采样的重过滤效果在运算逻辑单元(ALU)执行,因此受到TPU瓶颈。解决这一问题的简单方法是增加TPU单元的数量与USC/ALU的比例。然而,这不是好的策略。首先,在常规渲染过程中,ALU与TPU的比率已经是最佳的了。同时,带宽也无法足够满足更多TPU的吞吐率需求。而Imagination的技术可在保持整体平衡的同时,将执行效率提升一倍。
RISC-V技术支持
Imagination持续投入RISC-V的研发,将其成果应用于其产品线中。DXT中使用的遵循RISC-V协议的固件处理器,可以实现40%的固件性能改善,并且该固件已经在其汽车GPU BXS系列产品中得到验证。IMG DXT还受益于RISC-V的电源域特征,把重点放在降低空闲功率关闭不使用的GPU部分和优化随机工作负载性能上。
Pipeline Data Master技术
Imagination的PowerVR GPU从一开始就由固件处理器驱动。固件处理器负责工作负载的高级调度和优先级,允许并发处理不同类型的作业PowerVR GPU具有每个作业类型的数据主控器,计算和2D(或数据移动)。
如示意图所示,通过更紧凑的任务调动,可以使处理器始终在运行提前准备好的数据,从而带来全域5%的画图和计算性能提升。
ASTC HDR支持
Imagination此前已支持Khronos Vulkan API要求的自适应可缩放纹理压缩(ASTC)的低动态范围(LDR)。但是ASTC的高动态范围模式还不能支持。DXT系列新增的HDR功能,可以捕获更多的纹理信息,提高可视范围。
如图所示,从暗到亮,HDR支持可以展现更多细节。
总结
凭借着在光线追踪技术的领先,Imagination实现了GPU IP的准确定位,在如今竞争激烈的市场中,可以与其他便携甚至桌面级供应商扳一扳手腕。Imagination通过推出更具性价比,更低功耗,更高性能的DXT系列,意图将光追技术迅速普及开,从而在GPU市场中继续保持差异化的领先性。