若何评价NVIDIA RTX 4090 显卡?

13分钟前阅读1回复0
kanwenda
kanwenda
  • 管理员
  • 注册排名1
  • 经验值176110
  • 级别管理员
  • 主题35222
  • 回复0
楼主

​ 目次

AIC非公解禁比拟Founder Edition要晚一天,相信各人之前也应该看过其他RTX 4090评测,但本文游戏测试部门会愈加详尽,全数包罗性能阐发和比照视频,而且差别化概念也应该会帮你更为全面的认知RTX 4090那个产物。本文篇幅较长,若是碰见你不感兴趣的部门,能够跳过,通过目次选择继续阅读后面内容。

你实的需要比RTX 3090Ti更快的RTX 4090么?

其实良多人认为,RTX 3090Ti就那么快了,实的还需要更快的显卡么? 我用GTX 1060玩游戏不是很好么?

若是你实的如许想,那就根本能够申明你不是RTX 4090的目的用户。大部门30系列高端卡的用户都是晓得3080/3090那个级此外显卡是完全不敷用的:

3090Ti 赛博朋克2077开启RTX 4K 再开启DLSS性能,勉强均匀60FPS,打起来就跌成狗;玩个地平线5也就勉强90FPS。什么? 90 FPS还不满足么?

要晓得如今4K 160 HDR1000的fastips+miniled已经不要5000,要求低点,撑持HDR10的4K144也就3000不到,比拟动辄万余元的3090/4090就是毛毛雨。因而在2022年的今天,关于旗舰卡,不只讨论1080p/2K分辩率意义不大,以至单纯4K60都是离开目的用户需求,如今阶段的性能应该以4K120以至144/160为目的。三星奥德赛G8 4K 240Hz也就不到10000,关于RTX 4090的目的用户也是很轻松肆意的选择。

因而如今阶段用户关于GPU性能需求的增长,次要鞭策力不是新的3A游戏,而是更高刷新率的4K显示器。如今那些目的用户,他们最关心的是RTX 4090在4K分辩率可以比3090 Ti快几。

关于筹办购置RTX 4090火神的伴侣,也能够借读此文,更全面的领会那个产物的设想和做工,帮忙你停止购置决策。

RTX 4090比3090 Ti规格高几?

当初从晶体管数量和FP32(单元10亿/TFLOPS)理论性能来说,RTX 4090是比来10年性能提拔幅度更大的一次,别离提拔了170%和106%,在那种图上我们能够发现一个规律,工艺换代时候的性能提拔幅度更大,而此次RTX 4090则是至少吃了2代的工艺盈利。

RTX 30利用的三星8nm工艺素质是10nm,而RTX 4090则是接纳的台积电定造4nm工艺,至少前进了2代半。RTX 4090是763亿晶体管,608mm2的核心面积,就说每mm2有1.25亿晶体管,比拟0.45亿的RTX 3090 Ti密度提拔了178%,而且提拔的不只是工艺密度,还有频次,如今RTX 4090的核心频次也从1860上升到2520MHz,提拔幅度高达35%,如许的工艺盈利是史无前例的。

ADA的架构 暴力为王的传统性能

再来说说架构,早一天的首发评测应该都没少说,不外我觉得大多根本都是按NV给的PPT照本宣科。而我的解读会比力通俗曲白,但虽然如斯,那部门仍是需要读者需要必然的计算机和图形学常识,若是不敢兴趣,那部门也能够跳过。

40的的SM部门整体构造和30变革不大,一个SM分红4个处置块,每个块有16+16个FP32流处置器,总计有128个FP32流处置器。但和30一样,每个块有一组16个FP32和INT32共用通道,若是运行INT32的话,那那一半的FP32是不克不及工做的形态。

一般的游戏大要有1/3的指令是INT,那就意味着整体一般有1/6的FP32是无法工做的。那也是30系比拟20系的性能提拔幅度要小于流处置器规模提拔的原因。

Ada在L1数据缓存和纹理单位设置装备摆设上比拟Ampere也没变革,就说在传统光栅化部门在SM部门架构同Ampere一样,变革的仍是Tensor Core和RT Core部门,那在后面详细再说。

Ada 12个SM构成个一个GPC,那一个GPC就有128 x 12 = 1536个流处置器,每个GPC里还有2组总计16个的ROP光栅化单位(下方青色),那部门构造也是和Ampere一样。

之前的GA102是有7个GPC,3090Ti是完好规格,一共1536 x 7 = 10752个流处置器,而如今Ada完好的AD102则是12个GPC,一共 1536 x 12 = 18432 个流处置器。但考虑到良品率问题,RTX 4090是有16384个流处置器,比拟满规格少2048个,16个SM,一又三分之一个GPC,就刚好是一个RTX 2050的规模,那也是给出RTX 4090 Ti留有余地。

RTX 4090和RTX 3090 Ti一样有完好的6组32bit内存控造器(摆布两边的灰色部门),构成384位位宽。但不同是有96MB L2缓存,是GA102的6MB的16倍。

如许大缓存很天然的会让人想起RNDA2的Infinity Cache无限缓存手艺,根据AMD的研究,96MB的缓存能够将射中率提拔40-50%,不外那应该是256bit的数据,384Bit的AD102收益应该没如许高。其实我不断有如许的疑问,花如许大的面积和晶体管堆L2缓存实的比加显存带宽廉价么? 其实做个512Bit 16GB也应该不错,不外从汗青上看,512Bit卡根本都没什么好下场。

Locuza绘造的AD102芯片规划图,正中间是控造部门,两边是各48MB L2缓存,上下各6个总计12个GPC,左上中环绕的是12个32bit GDDR6X显存控造器,下方靠左是16x PCIe 4.0的接口,AD102是彻底没了NVLINK接口,能够跟SLI彻底说拜拜。其实我如今仍是非常思念昔时用470 SLI玩BFBC2和670 SLI玩BF3的日子,那应该是我玩游戏最高兴的一段时间。

以巧取胜的第三代RT Core

再来说变革的部门,起首是第三代RT Core。第三代RT Core起首一点变革是增加了Opacity Micromap Engine,之前在做第一步BVH遍历和穿插的时候,需要对每个光线停止计算,在碰见植被树叶和火焰如许不规则的复杂半通明物体时候,效能会大幅下降,而通过Opacity Micromap Engine则能够停止遮罩,后续只用途理边沿部门,如许能够大幅提拔性能。

第二点变革就是增加的Displaced MicroMesh Engine,在之前传统体例处置一个外表有良多多边形细节的物体,停止光线逃踪计算时需要对每个多边形停止零丁的BVH遍历,但Displaced MicroMesh Engine能够将整个多边形物体做为一个多边形+位移深度信息停止整体处置,到达大幅削减BVH计算量,提拔性能的目标。

或者能够如许说,Displaced MicroMesh Engine能够说是光线逃踪版本的Tessllation曲面细分,过去曲面细分是通过高度映射信息展示外表的凸凹感,而Displaced MicroMesh Engine表示的除了多边形细节以外,还有细节外表的实在的光照反应。

NVIDIA关于第三代RT Core的改良都并非暴力的增加规模,而是通过新功用的巧劲进步效率,少做无用功。不外那两个功用是需要游戏停止专门优化才气实现,就是说现有光逃游戏是其实不能从中获益。

而传统部门架构变革不大,根本就是暴力的堆砌规模和频次:RTX 4090在传统光栅化性能方面,FP32流处置器/光栅化单位/纹理填充单位根本都是等比例的提拔了52-57%,再加上频次提拔了35.48%,那FP32/像素填充率/纹理填充率那些传统理论性能目标根本都有106-112%的提拔(那些目标的计算办法都是基于单位数量 x 频次)。

Tensor Core部门次要是增加了FP8,其他FP16/TF32/INT8/INT4都是和FP32一样,得益于SM规模和频次的同比增长,单个Tensor Core规模/效能并没有变革。RT Core那些因为架构有改良的部门提拔幅度更大,根本有150%再往上走。当然那个仅仅是理论性能,其实不能完全代表在实在游戏里的性能表示。

单纯说硬件规格RTX 4090相关于RTX 3090Ti有超越100%的提拔,那现实跑分和游戏有如许的表示不?如今单刀曲入,间接测试来答复那个问题。

测试平台和申明测试平台我仍然选择12900K,但为了尽量阐扬性能将P-core超频到5.1GHz,uncore超频到4.3GHz。驱动利用RTX 4090首发测试驱动521.90,而且开启Resize BAR。

我们测试详细利用是七彩虹iGame GeForce RTX 4090 Vulcan OC,其供给了2组差别频次的BIOS:

一组默认450W能够拉到480W,2520MHz的核心频次,尺度的NVIDIA的参考设想规格;别的一组默认515W,能够拉到550W,2625MHz核心频次比拟参考设想要高105MHz。比照测试的RTX 3090 Ti核心频次为1920MHz,默认450W TGP。3DMARK性能测试

在详细游戏测试之前,我先用3DMARK来摸摸RTX 4090的根本特征。3DMARK是比力地道的DirectX测试,并没有额外的厂商优化,,而且能够剔除处置器和其他硬件关于性能影响,我们别离测试Firestrike Ultra/Timespy Extreme和Port Royal项目标图形分,那三个项目别离考察4K分辩率下DX11/DX12和DXR的性能。

RTX 4090在代表DX11性能的Firestrike Ultra和DX12性能的Timespy Extreme比拟RTX 3090 Ti别离提拔了85%和79%。

代表DXR性能的Port Royal测试,RTX 4090比拟RTX 3090 Ti进步了78%,我们如今能够看见120FPS的光逃3DMARK;RTX 4090火神的高频BIOS比出厂频次提拔了2%的性能;RTX 3090 Ti在接口带宽砍半的情况下性能丧失了0.35%,而RTX 4090则丧失了0.9%。带宽砍半关于性能的影响不算大,PCIe 4.0拆分红2个8x仍是能够承受,但老旧的3.0平台我其实不建议上4090,次要是PCIe 3.0时代的处置器性能不克不及满足需求,别的那也申明了目前PCIe 4.0并非瓶颈,5.0如今没有需求;超频2815/1488MHz得分可达27763,比拟默认提拔7.9%。频次/功耗/温度和超频

除了用3DMARK跑分,我们也用3DMARK阐发RTX 4090的频次不变性/功耗和温度。(9月底25度设定空调房测试)

RTX 3090 Ti不变运行频次在2GHz摆布,其实N卡自从GTX 10系列起头在2GHz频次已经停留很久,而TSMC 7nm的AMD RNDA1频次就能够到达2.5GHz,而RDNA2更是能够到2.7GHz以上,如今NFAN末于不消再眼红A卡的频次了;如今接纳5nm的RTX 4090在2520MHz的默认频次根本能够不变2730MHz,而且不触及温度和功耗墙,非常不变,2.73GHz比拟2GHz的RTX 3090 Ti提拔了36.5%;而利用超频BIOS的2625MHz的频次,则根本能够不变在2790MHz;手动超频到2815MHz(需要加+10%电压,不加压大要能够到2800),开头更高能够BOOST到2985MHz,后面不变2975MHz,而且通过20回合的不变性测试。若是再往上拉到3000以上频次,固然解锁加压能够过3DMARK,但不变性不敷以通过不变性测试(仅代表测试个别)。

即便利用超频解锁BIOS,将功耗限造拉到550W,但现实测试和游戏根本仍是超不外450W,Port Royal根本在400-450W范畴颠簸,大多游戏根本在350-400W区间(详细能够看后面游戏比照视频),包罗解锁到600W的Founder Edition也一样,都是仍是被频次限造。不外在加10%电压超频后,功耗根本在470-500W范畴,公版参考设想450解锁480W就不敷用了,我们测试的火神更高550W仍是有一些性能收益。

在让我以至一度思疑NVIDIA对功耗做了限造,但现实Furmark甜甜圈仍是能够到550以至560W的,而且那个功率的满载温度还不到70…… 2200的转速也不算高,我原来还想看看显存温度,不外目前传感器还读不出来,不外型号频次和RTX 3090 Ti一样,那应该不同不大,就看看散热改良了几。我利用热成像在0.8的发射率看了RTX 4090此时的温度:顶部更高为中间裸露的热管,65度,后背更高是核心后背71.9度,12VHPWR线接口温度为56度。

七彩虹iGame GeForce RTX 4090 Vulcan OC运行10分钟的Port Royal测试更高温度仅为63度(设定温度25度的空调房,裸机测试),超频后也仅为65度,而且电扇更高转速仅为1800RPM,仍是比力恬静。而RTX 4090 Founder Edition更高温度为73度,火神有10度的优势。 而且那仍是高负载的光逃测试,现实游戏一般在60度以下,以至我都有点怕GPU伤风了。RTX 4090火神是怎么可以用风冷将450W的RTX 4090压服如许低温度的,在本文稍后的拆解部门我们会详细解答。

能耗测试:把4090降到300w 仍是有91%的性能

因为RTX 3090 Ti和RTX 4090的TDP都为450W,RTX 4090的性能领先幅度就是能效领先水平。我们别离在150W-450W以50W为间隔测试RTX 3090 Ti和RTX 4090的3DMARK Port Royal性能,并记录核心频次。RTX 4090即便是在300W,也有91%的450W的性能,350W/400W更是有96%和98.6%的性能,NVIDIA为了逃求极限性能看来在功耗上仍是牺牲了良多的。若是把RTX 4090做成300W TGP那就是比力类似Apple M1 Ultra的思绪,用更大规模换取更低功耗,但如今NVIDIA如今是性能至上。

游戏性能测试

游戏测试我尽量选择一些有人玩,有手艺代表性的游戏,但为了更为准确的比照,测试游戏必需有Benchmark或者有可切确反复场景。再者需要游戏对GPU的负载高,不克不及有明显的CPU瓶颈,因而适宜测试的游戏范畴就很少了,如今人气宇比力高或者比力新的的Apex/长时无间/蜘蛛侠都是无法满足测试需求,测来测去仍是那几个几年前的老游戏,其实我也有点审美委靡了。

极限竞速 地平线5

地平线5是我本年玩的时间最多的游戏,出格是风火轮DLC出了以后,地平线5我们利用游戏自带的Benchmark极端特效测试4K分辩率下的性能。固然根据NVIDIA的PPT,地平线5将撑持DLSS3,但目前只撑持原生分辩率。

固然地平线5并非RTX游戏,但也其实不意味那其系统需求低,之前RTX 3090Ti只能在4K分辩率极端特效跑90FPS,那对高刷显示器用户而言是远远不敷的,而如今RTX 4090就能够到达均匀163FPS,更低142FPS的性能程度,根本能够满足4K 144显示器用户的性能需求。

上面是游戏比照视频,我们能够留意到RTX 4090其实不像RTX 3090 Ti那样不断GPU满占用,那种情况一般是CPU的性能限造了GPU性能的阐扬。

最初的性能统计也证明了前面的推测,黄色是GPU FPS,蓝色是CPU FPS,橙色是游戏现实输出FPS,蓝色CPU FPS已经起头低于黄色GPU FPS,在低的时间点申明CPU性能已经成为了瓶颈,拖累了橙色的游戏FPS。如许的情况我在之前的Zen 4评测就有胜利预言,

守望前锋2

暴雪刚刚在10月5日发布了守望前锋2,我做为一个资深暴黑+手残(物理意义),天然也不克不及错过,因为我晓得不玩就没资格黑,我们利用4K 100%衬着分辩率超高画面设置停止测试。

之前NVIDIA宣传RTX 4090在守望2中2K能够到达500FPS,如许的宣传可能给与我过高的性能期望,但现实在4K超高特效“仅仅”跑了214.5FPS,比拟RTX 3090 Ti 提拔了60%,并且GPU全程高占用率,就说根本没CPU的瓶颈。151FPS的更低帧率也完全能够满足144/160Hz 4K显示器的性能需求。

地平线零之曙光

地平线零之曙光是SONY旗下流击队工做室开发的沙盒动做游戏,其接纳的Decima引擎,那个引擎也被较为普遍的利用在杀戮地带/灭亡搁浅等其他SONY第一方游戏上。地平线零之曙光在后续更新也增加了对DLSS 2.0的撑持,我们利用游戏内置的Benchmark停止测试,利用的更高画量设定。

RTX 3090 Ti在DLSS性能形式更低帧存在问题,但测试屡次成果仍然如斯;DLSS量量和性能形式FPS相差不大,能够优先利用DLSS量量,以至是原生分辩率;RTX 4090在开启DLSS后,GPU占用大要只要70%,是明显的12900K 5.1GHz的CPU瓶颈(如视频)。荒野大镖客救赎2

荒野大镖客救赎2接纳R星自研的Rage引擎,无论是是西伊丽莎白壮美的薰衣草花海+雪山,仍是人流如织灯火阑珊的圣丹尼斯都美的让人打动,完全动态的实不时间和气候变革让整个游戏世界及其生动华美,R星的开发团队通过引擎精雕细磨再现一个浓缩的19世纪末美国。我们手动将画面设置全更高(高级设置默认),利用Vulkan API,别离测试4K原生分辩率/4K DLSS量量/性能形式下的性能。

RTX 4090在开启DLSS后,性能能够满足4K144的性能需求,而且DLSS性能和量量形式性能不同不大,RTX 4090用户若是不是PVP的话,能够优先考虑DLSS量量形式更好的在游戏中看光景。

古墓丽影阴影

古墓丽影阴影固然是20世代首发的RTX游戏,次要是用光线逃踪来停止暗影和AO处置,但其图像引擎也颠末屡次晋级,可以撑持 DLSS 2.0,而且于比来增加了对intel XeSS的撑持。测试我们利用手动MAX的画量,分辩率测试4K TAA/DLSS量量和DLSS性能形式的性能。

RTX 4090 DLSS量量形式能够满足4K144 160的性能需求,除非你有更高刷新率的显示器,不然开DLSS性能形式意义不大;RTX 4090即便是在4K开启RTX的情况下,若是开启DLSS,测试场景的后端仍然会呈现CPU单帧耗时高于GPU 单帧耗时的情况,就是说超频5.1GHz的12900K仍然存在瓶颈,那个也是为什么开启DLSS后,RTX 4090性能提拔幅度小于原生分辩率的原因之一,不外马上发布新处置器就根本没瓶颈了。地铁离去加强版

地铁离去我我比来10年玩过的更好剧情导向FPS游戏,而地铁离去加强版在原版游戏根底之长进一步提拔了游戏的视觉效果,在原版只要阳光能天然照亮情况,那限造了手艺在游戏中许多位置的适用性。而在加强版来自太阳、月亮、天空、人造光线和所有其他光源的光能够照亮内部、外部、角色、仇敌以及兵器,极大改善了游戏的外不雅。暗中的内部情况洗澡在光线中,物体材量在光线的照射下闪灼着微妙的光辉,光线的颜色在整个场景中实在地呈如今玩家面前。当然为了实现那一点,每一束光栅化光线要么从游戏中删除,要么晋级为新的经改良的光线逃踪版本,因而地铁离去加强版是第一个必需需要撑持光线逃踪GPU才气运行的3A游戏。

地铁离去加强版的系统要求很高,RTX 4090在Extreme画量 原生分辩率也不克不及包管不变60FPS,即便是开启DLSS性能间隔不变高刷仍是有一段间隔,因而我会选择DLSS量量,停止我的从莫斯科到里海,再到贝加尔湖的路程。别的地铁离去加强版是目前RTX 4090我测试的游戏里功耗更高的游戏,根本能够不变440-450W。

至于截图我应该会用Ansel的超等分辩率功用,下面是我在地铁原版的游戏截图。

赛博朋克2077

扳机社动画赛博朋克边沿行者又带起了2077的一波热度,让游戏在线人数在出售近两年后又再立异高(估量是看完动画想干亚当重锤的人太多)。因而我们也停止了赛博朋克2077的性能测试。赛博朋克2077是第一个全面利用光线逃踪停止光照/暗影/反射处置的3A游戏,我们利用比来NVIDIA供给的内测版停止测试,设置光线逃踪极致,DLSS性能形式,利用游戏自带的Benchmark停止测试,别离测试4K原生分辩率/4K DLSS量量/性能形式下的性能。

RTX 3090 Ti开DLSS性能勉强60FPS,但其实不不变,出格是剧烈战斗的时候仍然卡成狗,而RTX 4090均匀帧数能够在100FPS以上,更低FPS也有85,固然满足不了高刷的需求,但足够能够流利玩下去。而DLSS量量比拟性能形式丧失较大,适宜4K60的显示器用户,而原生4K分辩率,即便是RTX 4090也是不成玩的性能。

赛博朋克2077我们利用NVIDIA供给的内部测试版测试了DLSS 3.0的性能。原有的DLSS 1.x/2.x是基于空间插值,简单的说就是用GPU衬着低分辩率图像,再通过深度进修算法“脑补”成高分辩率,生成不存在的细节,通过降低衬着分辩率来提拔性能,其实详细工做原理和美图秀秀美颜差不多。

而DLSS 3.0则是起首利用空间插值,将低分辩率实在衬着正插值到高分辩率,再按照运意向量的变革趋向脑补出后面的过渡帧,停止时间插值。

若是将1080p以DLSS 2 性能形式插值到4K,然后后面再以运意向量趋向生成一个过渡帧,那整个画面只要1/8是依靠GPU老诚恳实衬着,7/8都是靠Tensor脑补出来。

其实DLSS 3并非最早的基于时间插值的应用,SmoothVideo Project是一个视频播放器插件能够将视频插值到更高帧率,不外SVP次要是基于NVIDIA Optical Flow光流加速器(对 其实30也有,只不外规模只要RTX 40的一半)。但即便如斯SVP在铁蒺藜百页窗如许大量反复纹理场景插值仍是很容易呈现问题,而且那仍是在固定前帧和后帧的情况。

而游戏玩家和其他角色物件的运动又更多的不成缺定性,出格是赛博朋克2077摩托驾驶如许的高速不确定的体育场景,天晓得玩家会在0.1秒后怎么操做,DLSS3则是基于引擎运意向量和光流配合计算来预测运动趋向。

因为DLSS 3.0是后处置,是游戏输出画面之后再停止帧生成,就说游戏自带的FPS是无法显示DLSS3的插帧帧数,而Frameview和RTSS如许的第三样东西仍是能够一般识别,DLSS 3.0的帧数是游戏输出的两倍,而且如许两倍的性能其实不会增加CPU性能的瓶颈。

DLSS3其实画量也很难看出不同,DLSS2 DLSS3我在游戏全特效 封闭运动模糊锁定60/30FPS,用OBS当地以4K 60FPS 100Mbps的码流抓取,如许每1ms就能够对应到1帧,然后用ICAT逐帧的50/100%大小比照DLSS3和DLSS性能形式的相邻两帧画量,很难区别关键帧和插帧。DLSS3只是在高速体育场景,出格是快速扭转体育场景关于纹理量量有必然影响,但如许的负面影响和运动模糊效果很接近,也很难区分。不外DLSS输入的响应更慢,游戏法式的输入响应现实仍是插值之前的程度,就是说你不开DLSS 100 FPS,开了DLSS3 视觉流利度上是120FPS,但现实操做响应却只要60FPS的程度,那个就是游戏同SVP视频插帧纷歧样的处所。

目前有能够运行的DLSS3测试版游戏除了赛博朋克2077,还有蜘蛛侠、逆水寒、微软模仿飞翔、瘟疫传说:安魂曲,此外后续还有超越35款新游戏或者是现有游戏通过更新的体例供给对DLSS3的撑持。

别的我们也测试了下绝地求生,固然4K 3MAX次要是CPU瓶颈,但GPU也有明显影响,比拟260FPS程度的3090 Ti,RTX 4090仍是能够进步20多FPS的性能到280 FPS程度。不外PUBG次要仍是CPU瓶颈,我们其实不将其列为次要测试项目停止统计。

游戏性能测试小结:8800GTX之后,游戏性能提拔幅度更大的一次换代

算原生分辩率的话,RTX 4090在传统光栅化游戏中性能提拔欠债大要在50-77%,而在光线逃踪游戏性能提拔根本有80%,那根本是在8800GTX之后,游戏性能提拔幅度更大的一次换代,更重要的是在开启DLSS之后,RTX 4090根本都能够满足3A游戏在4K 144下的性能需求。

关于RTX和DLSS的成见

良多人关于RTX和DLSS五体投地。他们的概念是:要RTX做什么?光栅化没什么欠好,你看看大表哥2和美国高尔夫没RTX不是一样画面顶级么?RTX只是骗钱的新油头。

我在RTX 2080 Ti首发测试和战地V测试的时候就说过,光线逃踪是手艺开展的一定标的目的,是图形学皇冠上的明珠。固然光线逃踪在起头阶段都只是表层特效,不成能给游戏画面带来太大改动,但光线逃踪在开展起来之后,能够彻底改动游戏的视觉体验,而且简化游戏的开发流程,不是所有开发者都能够像R星和顽皮狗那样堆美工人力去做光源和烘培。

光线逃踪在降生4年以来得到庞大的开展,2018年的战地V每个像素仅仅颠末39次光线逃踪操做,而如今新版的赛博朋克2077已经增长到了635次,也降生了地铁离去加强版如许相对彻底依靠光线逃踪的游戏,更重要的是家用机也进入了次世代,PS5和Xbox series X也有光线逃踪才能,3A游戏开发商也更有动力开发光线逃踪游戏。

原图动态画量比照:CYBERPUNK 2077 DLSS OFF VS DLSS Quality VS DLSS Performance

再来说DLSS,若是说游戏人关于RTX只是回绝,而对DLSS则是深恶痛绝,如许同样是不成理喻:在赛博朋克的首发测试中,我就得出过结论,DLSS 2.0的量量形式在根本不消付出画量丧失的情况根本就能够白嫖一半性能,而DLSS性能形式性能几乎能够翻倍,略微付出一幅画量丧失也是能够承受,在剧烈运动和战斗中,如许的不同是很难被留意的(DLSS 3.0仅是静态展现,不代表动态画面画量),不信就点开上面临比图本身看看,用放大镜看看可以看得到几不同。若是你看不出不同,但心理上仍是承受不了DLSS,那那申明你有强迫症,得治。

即便是次世代旗舰RTX 4090在良多的3A游戏中,原生分辩率也是很低的,出格是以120或者144刷新率为目的,因而DLSS是很需要的,更不消说中端支流卡了,有些游戏没DLSS玩都玩不下去。

消费力性能测试

intel不断强调设想师电脑的概念,但现实消费力方面计算的主力早已经从CPU酿成了GPU,完满是为NVIDIA的STUDIO做了嫁衣,因而我们也简单测试了RTX 4090的消费力性能。

Blender 3.3衬着性能测试

Blender是一个免费的衬着软件,其撑持4种衬着途径,无是纯CPU衬着,HIP是AMD Radeon显卡公用,NVIDIA显卡则能够用CUDA和OptiX两种。OptiX是NVIDIA在GPU上实现更佳光线逃踪计算的应用框架,它能够通过可编程的体例对订交、光线生成、着色和降噪等操做停止高效处置。

Demo下载链接:

https://download.blender.org/demo/splash/blender_3_3_lts_splash_by_piotr_krynski.blend

我们利用上述链接的Demo停止衬着测试,RTX 4090利用OptiX完成衬着时间不到20秒,比拟RTX 3090 Ti要快73%,而RTX 4090 Optix比拟CUDA途径也要快158%。我们也利用12900K CPU停止衬着,完成时间需要580秒,RTX 4090根本只需要12900K CPU衬着的1/30时间。

达芬奇18编码测试

早几年达芬奇次要是做为调色软件存在,但比来的版本将剪辑、调色、视觉特效、动态图形、音频后期和发布停止了全流程整合,成为了一个全功用的视频软件,而且其Studio的付费版比拟Adobe PR更为友好,我已经有2位做视频自媒体的伴侣已经从PR迁徙抵达芬奇。我们此次测试是将一段126秒Prores422HQ 4K/8K视频别离用HEVC/AV1编码转换成MP4封拆,80Mbps固定码流,统计完成时间。(因为8K测试文件容量高达46GB,那个测试完全阐扬性能需要64GB内存,因而我改用海盗船复仇者32GB 5600 x 2内存停止)

H265的4K和8K编码性能RTX 4090比拟RTX 3090 Ti进步128%和145%,而AV1是RTX 3090 Ti间接不撑持的,因而就没成就。AV1是由Google主导的新一代开源视频编码,比拟H265在不异画量下码流大要要小40%,而不异码流的情况下画量更好,如许关于在线视频网站运营而言非常重要,能够大幅提拔用户体验并降低视频存储和传输成本。但视频编码晋级往往会招致编码的性能下降,那个问题关于H265来说就很明显,但如今借助RTX 40的AV1编码器,4K分辩率下性能根本一样,而在8K下,也仅仅是慢了8%,如许的编码性能关于内容创做和运营者而言有更大的吸引力。别的利用显卡视频编码器停止编码功耗也很低,大要就80-90W。如许的思绪和Apple M1差不多,用各类公用电路完成特定工做,低能耗又高性能,那个就是M1可以成为Finalcut公用机的原因。

SPECviewperf 2020性能测试

Specviewperf 2020是能够测试3ds Max、CATIA、Maya、Solidworks等专业软件的尺度测试法式,固然其负载比拟现实情况要轻,但仍是能够反响差别GPU的相对性能做为参考。

大部门测试项目提拔都在50%摆布;能源方面提拔很明显,而Creo 4提拔幅度很小;3ds Max/Maya提拔幅度较小应该是测试负载过轻,碰见CPU瓶颈了,如今看来Specviewperf有大更新的需要,让负载更接近现实利用情况。iGame GeForce RTX 4090 Vulcan OC外不雅和拆解

之前七彩虹iGame RTX 3080/3090除了战斧,所有系列都是接纳8pin x 3的设想,可以供给更高的TGP,而RTX 4090火神在前面的测试中,无论是性能仍是散热都有极佳的表示。如今再让我们来看看的iGame GeForce RTX 4090 Vulcan OC(简称为火神)的实容吧。

RTX 4090火神正面设想相对RTX 3090更简洁一点,外型并没像之前RTX 3090火神那样接纳大量凸起大角度的折线,而是比力朴直,外表有斜线纹路做为装点。RTX 4090火神的长度大要35cm差点,塞进去需要大一点的机箱。

上下有两个银色的金属粉饰件,斜角切面也很有量感,凸起部门互成犄角围绕在中间电扇,如许的设想也是延续了之前30系火神的设想语言。

RTX 4090火神电扇是接纳的3个10.5cm电扇,而且在扇叶外缘有边框,如许的设想能够加大向下气流的指向性,加大风压,而且边框可以进一步加强了扇叶构造强度,能够起到进一步降低振动和噪音的感化。

RTX 4090火神为三挡板,标配为3 DP1.4+1 HDMI 2.1,不撑持DP 2.0仍是略微遗憾,关于后续4K 240Hz那种高刷显示器HDMI 2.1仍是不克不及完美的满足需求。除此之外上面还有个双BIOS切换按钮,按下蓝灯亮起的时候是高频解锁BIOS,功耗能够到515/550W,而且双BIOS,后面刷BIOS玩的时候就更后顾无忧。别的三挡板能够更为安稳的固定,更好的支持近5斤的重量,其他家的RTX 4090我看根本都是两挡板。

RTX 4090火神的现实厚度其实超越了三槽一点点,厚度“仅仅”比iPhone的宽度宽一点。

其实比拟其他友商的动辄4槽的4090,那还算是苗条的,插在ATX主板上,至少还留了最初两个槽给你用,并且空间还比力宽裕。

此外,RTX 4090火神重量差不多有5斤,而大部门的RTX 4090以至是4槽卡都都只要4斤出头,满满当当重量的给人觉得很有充分感,当然也因为5斤的重量,我也建议列位利用显卡收架来制止下垂,还好显卡包拆里带有一个。

背板也很有设想感,黑色中框外夹亮面的iGame Logo,再加拉丝处置的背板主体,材量组合运用的很适当。再就RTX 4090彻底放弃了对SLi的撑持,因而没有NVLINK接口。

散热片现实是远长于PCB,热气流会从背板的镂空处排除,我估量如今高频的DDR5内存会有点定见:你考虑过我的感触感染么?当然,此外有定见的可能还有塔式的风冷散热器。(你不要认为4090用户都是用水冷)

RTX 4090火神顶部有一排金属触点,能够便利的挂磁吸式LCD智屏。

比拟RTX 3090 Ti火神的LCD屏幕,RTX 4090火神分辩率从480x128提拔到了800x216像素,画面细粒度大提拔。

能够通过iGame Center设定显示内容。

金属件边沿有两条ARGB灯带,色彩饱和度和亮度都不错,而且灯珠也不明显,但在ATX机箱一般安拆的情况下,电扇面向下根本就很难展示出来(不外我本身用的倒置的RTX机箱反而看得见)。此外RTX 4090火神还附带一个底座,能够将磁吸式LCD智屏固定在上面做桌面摆件。

那个时候显卡的侧面就空出来,iGame还供给了一个额外的ARGB照明模块用来提拔战斗力。

12VHPWR的接口因为接口设想的物理强度问题,大要只要30次插拔寿命,不外关于一般用户而言插好老诚恳适用并没什么问题,但关于我如许要经常换显卡平台的评测玩家就有点难受了,评测的时候我会用转接线,12VHPWR插着不动,一个萝卜一个坑,就插拔8pin那一头。

12VHPWR固然是NVIDIA在用,但那个锅不该该由NVIDIA来背,因为是intel定的标准。

比拟8pin的150W,单个12VHPWR能够供给600W的不变功耗,撑持更高55A的电流。

其实最早在3080/3090 Founder Edition上NVIDIA就引入了12pin的接口,12VHPWR在此12pin根底上增加了额外4pin信号接口,在3090 Ti初次利用。

能够通过4个信号摆列组合通知ATX 3.0电源需要输出的功率,能够在150/300/450/600之间调理。

除此之外,ATX 3.0的12VHPWR还要求电源可以供给更高的瞬时负载才能,要求100微妙/1ms/10/100ms可以供给200%/180%/150%/120%的瞬时负载才能,当然那个仅仅是瞬时要求,并非让厂商做2000W当1000W买,其实加大主电容再优化下就能够搞定。

12VHPWR固然长处良多,但缺点也很明显。要实现12VHPWR的全数功用,需要原生的ATX 3.0电源。

好比海韵的钛金旗舰TX-1600,仅仅是兼容ATX 3.0,额外供给一组双8pin转12VHPWR,而不是原生的ATX 3.0电源。

若是你没ATX 3.0电源或者电源原生12VHPWR线材,七彩虹也供给一组8pin x4到12VHPWR转接线,安拆的时候尽量利用4根独立的8Pin停止转接。

但如许转接,显卡外部的线材就会一大坨(四条尾巴以至让我不由想起来自深渊的法普塔……),及其不美妙,不只会遮挡标致的LCD智屏,而且一大坨线材可能被玻璃侧板压迫,如许大角度的弯折其实也倒霉于转接线的寿命,关于我如许的强迫症觉得很难承受。

因而此次测试我选择利用了Tt TOUGHPOWER GF2 1350W电源,其根本是最早上市的原生ATX 3.0电源,在电源端供给了12VHPWR接口。仅需一根线就能够输出600W的供电。GF2 1350W 12V输出电流为112.5A,仅12V就有1350W的输出功率。在转换效率方面其通过80 Plus的金牌认证,而且供给10年量保。

若是你有一个不错的1000W以上的ATX 2.0电源,觉得换掉可惜,能够询问厂商时候能够零丁以至或者购置两8pin转12VHPWR曲连线,目前华硕/海盗船/海韵都有供给。

在是12VHPWR供电接口旁边的非标8pin接口是和主板通信/ARGB同步数据线接口,如许能够通过5V 3pin/USB实现同主板可寻址的灯光同步和iGame Center软件控造。但那个接口设置在那正面就会多一根线,其实仍是比力影响美妙,其实之前RTX 3090用零丁小板做在前部仍是更合理。

单纯从工业设想程度和审美情趣看,RTX 4090火神应该同Founder Edition/STRIX同处第一梯队,明显高于其他一个段位,我对其外不雅设想和量感都非常满意,但在接口和灯光规划上仍是有优化空间:

主板毗连线的位置不美妙,毗连线在正面太明显影响美妙,其实30火神前端段安插更好;供电接口其实更好也能够挪动到前端,如许不只更美妙,而且能够制止供电线(出格是转接线)被机箱侧板压迫的问题(固然那会进一步增加机箱的长度要求,但问题不大);RGB照明除了侧面的屏幕和灯光模块,都在正面,但在一般安拆的ATX机箱证明是向下的,而三槽+的厚度也根本不克不及竖插,如许正面的灯光根本是看不见的,灯光的重点仍是应该在侧面和背板。拆解

接下来进入喜闻乐见的拆解环节,起首是PCB部门:PCB除开背板,整体还有个包抄式的金属中框来加强构造,制止被散热器压变形。

RTX 4090火神的PCB长度大要为23cm,为了塞下更多的供电,PCB高度略微有一点点越肩。

GPU供电是24相,显存供电是4相,而4090 Founder Edition是20+3,还有两相是空焊。

RTX 4090装备的AD102-300-A1核心面积为608mm2,固然比拟GA102的628mm2稍小,但在一幕102里仍是算是大尺寸。核心四周围绕12个单颗容量为2GB的32bit GDDR6X显存。

美光的FBGA编码为D8BZC,详细型号是MT61K512M32KPA-21:U,和RTX 3090 Ti一样,21Gbps的频次,其实美光已经量产24Gbps了。

散热逻辑

再来看看散热部门:其实前面的测试,RTX 4090火神的散热效果能够说是远远超出我的预期,游戏根本60度摆布,完全解锁功耗烧甜甜圈550W也就不到70,其实我猎奇那个是若何实现的,接下来我们看看RTX 4090火神的散热计划到底是怎么样的产物逻辑。

风冷显卡散热需要处理的有三个问题:

核心到散热器底部接触面的热量传导;散热器底部接触面到鳍片的热量传导;鳍片将热量散发到空气中。

起首是第一步,核心到散热器底部接触面的热量传导,RTX 4090和RTX 3090 Ti TGP是450W,大要核心是350W,显存是90W,两者核心面积是608和628 mm2,如许我们能够算出RTX 4090核心的功耗密度为为0.56W/mm2,固然接纳先辈的台积电5nm工艺,功耗密度几乎并没有上涨,比拟12900K/7700X根本只要他们的1/2和1/3不到,而且是裸Die曲触,也没CPU那样的金属顶盖+钎焊,因而底子没积热的问题。

第二个问题是散热器底部接触面到鳍片的热量传导,凡是办法是热管。一般6mm热管15cm长度的有效散热才能是48W,即便塞10根也就480W程度,而且那只是没考虑弯折压扁的情况,现实还要大打折扣,因而传统的6mm热管是不克不及很好满足450-550W的散热需求的。

RTX 4090火神接纳的体例接纳更大曲径的8mm热管,其在15cm间隔能够有74W的传导才能,高性能版以至能够到90W,而且弯折和压扁的性能衰减更少。而且七彩虹一次性接纳了9根8mm的热管,如许就能够压造更高550W的RTX 4090。

利民新一代的散热器在200摆布的廉价货就是接纳的传统6mm,而旗舰FC140就是8mm x 5,可见8mm仍是有明显的性能优势。

但如今又有了新的问题,RTX 4090的核心AD102,核心面积是608mm2,高度只要26.3mm2,若是上面笼盖8mm热管,无论是利用铜底仍是热管曲触,即便完全并拢根本只要三根热管能间接在核心上方,其他热管根本就是打酱油。

为领会决那问题RTX 4090火神利用了核心和显存全笼盖的整体式均热板。

均热板能够将热量敏捷传导到热源的10倍面积,并只要0.5度的温差。操纵如许的特征,RTX 4090火神能够高效的将核心热量传导到全数的9根热管,从而处理那个问题。固然此次RTX 4090根本都是接纳的均热板+热管的散热计划,但RTX 4090火神的8mm x 9的热管规模是已公开的RTX 4090中更大的。

七彩虹在RTX 30的高端卡就接纳了逆重力热管,一般热管在倒挂的情况下效能会大幅下降,没有接纳逆重力热管的RTX 3090在一般机箱满载温度70多度,但在垂曲风道机箱倒挂就会到差不多90度,而逆重力热管则可以很大水平改善那个问题,而RTX 4090火神则延续了逆重力热管的设想。

第三个问题鳍片将热量散发到空气中,那个就相对好处理,堆散热片的规模就能够,RTX 4090火神仅仅是接纳三槽,比拟其他家动辄4槽起步看上去并没有那样夸大。但需要晓得散热才能与散热器外表积成反比,同气畅通过量的平方成反比,就说4槽散热鳍片越厚,风阻就越大,更难吹透,通过和气流量就越少,如许拔苗助长了,因而散热片也不是越厚越好。而七彩虹iGame RTX 4090火神则是着重处理前面几个阶段的热量传导问题,再共同特殊为风压优化的10.5cm大尺寸电扇,能够吹透的三槽,比拟单纯加厚的4槽其实还有更好的效果。

RTX 4090值得购置么?

Q: RTX 4090比拟RTX 3090 Ti有多大提拔?

RTX 4090比拟RTX 3090 Ti在传统光栅化游戏中大要有60%以上的提拔,而光线逃踪游戏提拔根本有70%。如许的提拔幅度根本是8800GTX以来更大的一次,事实吃了量代的工艺盈利。而且那个幅度仍是低于规模 x 频次的提拔幅度,后续驱动和游戏优化 仍是有进一步进步的空间。

其他媒体测试的提拔幅度较小,应该是没有选择能够完全阐扬性能的游戏,或者测试平台有很明显的瓶颈招致。

Q:我需要购置RTX 4090么?

A:若是你和我一样热爱3A,而且有个4K高刷新的显示设备,那你就需要RTX 4090。但问题是你在买之前需要考虑下本身要玩什么?

我在前面比力多的强调RTX 4090能够在现有3A游戏中满足4K144的性能需求,但那也不是说后面的新游戏就没盼头,至少我如今仍是很等待星空和家园3,比来有B社员工在Linkedin说他在做星空的光线逃踪集成,那让我那个画面党又多了一点等待。

Q: RTX 4090电源有什么需求?

A:850W应该够,但接近满载化了大,毛病率高,老化快,建议仍是1000W起步。用8pin x 4转12VHPWR实的很丑,完全不克不及忍,但如今原生ATX 3.0电源选择不多,又贵,而且规格也不高,根本都是仍是金牌。若是你已经有个1000W以上的电源,能够先继续用,比及ATX 3.0电源选择余地更多而且价格比力适宜的时候再买,当然更好申请或者购置双8pin转12VHPWR的曲插线,如今1拖4实的很丑。

Q:RTX 4090关于CPU有什么需求?

A: 那个次要取决于你显示器的刷新率和玩的游戏。若是你发现游戏的GPU利用率不是不断99%,100%,那申明你的CPU性能存在瓶颈,而且那个帧数低于你的显示器刷新率的话,那就申明你有晋级CPU需要,建议改换Zen 4或者intel 13代处置器。

Q:RTX 4090值得买么?

A:RTX 3090在矿卡横行的情况下如今仍然有5000的二手残值,RTX 4090在生命周期完毕前的残值应该会更高。预估根本5000成本就能够享受2年的旗舰。固然后面再也没什么矿潮,显卡也很难涨价,但仍是那话,早买早享受,顶多比及双11,看价格会不会再低点。我认识有3090的90%玩家都筹办近期购置(留意是玩家)。

Q:RTX 4090火神你觉得怎么样,说实话。

A:工业设想标致,量感好,散热好,也恬静,比拟公版频次更高,TGP上限也更高,我觉得仍是不错的,若是隐恶扬善的话灯光和接口安插再完美一下,就更完美了。

0
回帖 返回购物

若何评价NVIDIA RTX 4090 显卡? 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息