GeForce RTX 4080 16GB终于在今晚迎来解禁。本期我们就率先上手了一款采用了360冷排的RTX 4080一体水冷显卡--七彩虹iGame GeForce RTX 4080 16GB Neptune OC,如此奢华的规格无疑让它的散热才干十分让人等候。 01/ Ada Lovelace架构与RTX 4080 GeForce RTX 4080 16GB显卡采用的是AD 103-300显现中心,该中心基于TSMC 4N工艺和Ada Lovelace架构中心中止制造,其芯片面积为378.6 平方毫米,晶体管密度为459亿。 其中,Ada Lovelace架构中心配备了全新的第三代RT Core(光线追踪中心)、第四代Tensor Core(张量中心)以及SM(流式多处置器)。 依据NVIDIA官方的引见,Ada Lovelace架构中心所采用的第 3 代 RT Core 不只将光线与三角形求交性能进步了一倍,还将 RT-TFLOP 峰值性能进步了一倍之多。第 3 代 RT Core 还配备了全新的 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎,进一步提升了光追计算的性能以及减少计算开支,带来了更好的光线追踪效果表示。Ada Lovelace架构中心配备的第四代Tensor Core更是引入了来自专业级H100数据中心GPU的 FP8 Transformer 引擎,从而带来了愈增强悍的AI算力。 ▲第三代RT Core结构表示图,相比前代,增加了2个功用 Ada Lovelace架构中心在SM单元上引入了Shader Execution Reordering(SER 着色器执行重排序 )技术来更好的关于着色器的工作中止调度排序,在运用上能够依据不同的负载需求来执行渲染,可对负载较为统一的画面中止渲染,降低工作开支。 依据英伟达官方的引见,这一个SER功用将作为API开放给开发者运用。英伟达官方宣称,SER功用的参与最 高可带来两倍RT Core性能上的改善,关于光追游戏来说更可带来体验的升级。依据NVIDIA官方的数据,全新的SM(流式单元处置器)可带来最 高两倍的性能以及能效升级,升级幅度是十分明显的。 ▲Ada Lovelace架构中心 SM结构图 Ada Lovelace架构中心除了第三代RT Core(光线追踪中心)、第四代Tensor Core(张量中心)以及SM(流多处置器)的升级以外,带来了全新的第八代NVENC双硬件编码器,这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持,能够在传统的H.264等格式之外,参与了对AV1这一主流新规范的支持,能够中止关于AV1格式的编码与解码,有效提升了消费力方面的表示,关于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显现,第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率进步了40%,这一提升十分明显。 除了中心上的升级以外,Ada Lovelace架构中心还大幅度提升了其L2缓存,GeForce RTX4080 16GB具有64MB的L2缓存,大容量的L2缓存带来了数据命中率的有效提升。在现阶段显存带宽提升有效的状况下,经过升级更大容量的L2缓存,能够提升数据命中表示,带来性能方面的升级,依据NVIDIA官方的说法,大容量L2缓存的参与为GPU的一系列操作带来了更高的收益,特别是在光线追踪等场景下,表示更为明显。 ▲RTX 4080 16GB中心架构图 Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。 DLSS 3包含有DLSS 2(DLSS超分辨率技术),以及全新参与的DLSS帧生成技术,这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处置器以及Tensor Core的AI算力。在一项技术在运转过程中,其经过光流处置器所得到的一系列数据后,以光流加速技术(Optical Flow Acceleration,简称为OFA)来生成画面信息,而AI算力则担任来对画面中止进一步的优化,从而在游戏中参与了更多的帧画面,中止帧数的提升。 DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于运用1/8的算力,就完成了整个计算过程,而经过这一个流程的循环,可在提升帧数的同时俭省资源开支,进一步带来更好游戏体验。 而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因而DLSS 3在运用上也将经过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而依据NVIDIA官方的说法,DLSS 3经过整合NVIDIA Reflex以及一系列的技术,能够使得游戏体验具有媲美以至是超越原生级的渲染、操作体验。 得益于愈加先进的制程工艺,GeForce RTX 40系列显卡在晶体管密度与中心频率上都有着相当显著的提升。此次测试的RTX 4080 16GB的CUDA中心数曾经可与上代旗舰型号RTX 3090 Ti比肩,并且公版卡就完成了高达2.5GHz的加速频率。我们此次测试的iGame GeForce RTX 4080 16GB Neptune OC更是完成一键超频至2.6GHz的加速频率。同时,它们的功耗,仍远远低于RTX 3090 Ti。 02/ 外观拆解 七彩虹iGame GeForce RTX 4080 16GB Neptune OC采用了颇显质感的雪白合金外甲,其标记特征由上一代的圆环形的海洋之眼进化成为了双波浪曲线,并且具有RGB灯效,令其“海神”的意味性愈加鲜明。 3个大尺寸风扇不只具有也能带来更大范围的灯光效果,分离上七彩虹iGame GeForce RTX 4080 16GB Neptune OC显卡本体上的灯光效果,能够具有超出风冷显卡上限的灯效展示区域。 得益于360冷排的散热设计,七彩虹iGame GeForce RTX 4080 16GB Neptune OC显卡本体部分能够做到仅仅只需两槽的厚度,也是这次RTX 40系高端卡中的纤薄选手了。 七彩虹iGame GeForce RTX 4080 16GB Neptune OC显卡提供四个视频输出接口,包含三个DisplayPort 1.4a和一个HDMI 2.1接口,均可完成至多4K 120Hz的视频输出,并可完成最多4屏输出,支持HDCP 2.3,HDMI 2.1接口还支持8K 60Hz HDR以及HDMI 2.1a 接口的可变刷新率功用。 上机点亮,七彩虹iGame GeForce RTX 4080 16GB Neptune OC在灯效加持下能够模仿水的活动方向,具有灵动生机感。 官网下载新版iGame Center还能够支持硬件监测、灯光同步、手动超频等丰厚功用。 拆开显卡能够看到,七彩虹iGame GeForce RTX 4080 16GB Neptune OC采用了显卡的供电细致散布是22相供电给中心,4相供电给显存,远超公版规格。 显卡基于AD103-300-A1中心打造,旁边的是12颗来自美光的GDDR6X显存,每颗显存都是2GB的容量,组成24GB的总容量。PCB背面没有布置显存,主要是布置包含聚合物电容在内的各式贴片元件,以及供电控制的PWM芯片。 冷头部分有很大的纯铜底座与GPU中心接触,能够及时的传导热量,各种高发热的电子元器件位置也都布满导热贴增强导热效果,七彩虹iGame GeForce RTX 4080 16GB Neptune OC显卡具有一块金属背板,维护PCB的同时也有辅助散热的作用,背板内侧面上掩盖有大面积的绝缘层来增加电气性能的稳定性。 03/ 理论测试 强大的CPU单核性能对往常高端显卡的性能释放十分重要,此次测试我们选择了13代酷睿i5-13600K平台,并将大核手动超频至5.7GHz,尽量减少CPU构成的显卡性能瓶颈。 从GPU-Z能够看到,七彩虹iGame GeForce RTX 4080 16GB Neptune OC在默许方式下的加速频率是和公版分歧的2505 MHz,默许TGP也同样是320W,最大解锁至350W. 按下一键切换BIOS按钮后,显卡的加速频率抵达了2640MHz,默许TGP也提升到380W,最大还能经过软件解锁到470W,这也为超频带来了很大的操作空间。后面的测试我们也将采用这一方式中止。 在3DMark基准测试当中,iGame GeForce RTX 4080 16GB Neptune OC跑分曾经全面超越了前代卡皇RTX 3090 Ti,而且抢先幅度以至高达20%以上。 在DLSS基准测试中,iGame GeForce RTX 4080 16GB Neptune OC在DLSS 2方式下的4K性能提升了159%,DLSS3方式下更是提升了235%。 04/ 游戏表示 RTX 4080强劲的理论性能我们曾经众目睽睽,接下来是游戏帧数方面的测试。这里我们先分别在2K与4K分辨率下测试四款经典的游戏。 传统游戏测试 在《绝地求生:大逃杀》当中,iGame GeForce RTX 4080 16GB Neptune OC的表示如预期般超越了RTX 3090 Ti,抢先幅度在15%左右。 在其它大多数的大型游戏场景中,iGame GeForce RTX 4080 16GB Neptune OC的表示也都稳稳超越了RTX 3090 Ti,抢先幅度分别在15-20%。RTX 4080开启DLSS 2方式对比原生分辨率的性能提升则有30-120%不等。 仅仅除了在2K分辨率DLSS方式下测试《永劫无间》时,可能是由于帧率太高构成了CPU瓶颈,招致显卡占用不满,对比原生2K的实践帧率表示并没有提升,招致还不迭RTX 3090 Ti的状况。 DLSS 3与Reflex专项测试 接下来,我们再测试几款含有NVIDIA新一代DLSS 3技术的游戏,游戏的画质都会调至全高,看看这些游戏分别在原生画面、DLSS 2超分辨率、DLSS 3帧生成之下,性能与延迟的差别。 首先我们看看Reflex低延迟功用究竟有多大的作用,在《守望先锋 归来》当中g开启Reflex功用的延迟低了一半以上,而且对帧率简直没有影响。这一功用能够很好地减轻DLSS 3补帧功用增加的延迟,所以开启DLSS 3也会同步开启Reflex。关于延迟追求更高的玩家来说,运用Reflex+Boost还能够有进一步增强,不外效果就没有那么明显了,而且还会构成小幅的帧率损失。 在基于Unity的《Enemies》DLSS 3测试Demo里面,RTX 4080原生4K下只能跑到22帧,这种极低帧的方式下帧生成时间是很长的,所以延迟来到了192ms。而在翻开DLSS 3后,帧率抵达3倍以上,延迟也降到了56ms。 同样的状况也出往常《赛博朋克:2077》当中,原生4K下30帧的平均帧带来了117ms的画面延迟,画面卡顿、操作迟滞。而在开启DLSS 3后帧率提升到了95帧,延迟49ms,以至还比DLSS 2不开Reflex状态要更低。 相似的,在《幻塔》测试版中,由于这款游戏没有单独开启Reflex的选项,所以DLSS 3方式的延迟也要比DLSS 2下面更低。 赛博题材的横版3D游戏《生死轮回》里面,DLSS 3在完成原生分辨率近3倍性能的同时,延迟控制在了仅仅32ms。 在《瘟疫传说:安魂曲》里面,DLSS 3同样带来了较原生分辨率不止翻倍的提升,延迟的增加也不明显。 《阴影火炬城》里面,RTX 4080在DLSS 3方式的平均帧和DLSS 2方式差未几,应该是碰到帧率上限了,但前者在1%低帧的表示上有了比较明显的提升。 在《消灭全人类》里面,开启DLSS 3的RTX 4080也有着比原生画质翻倍的性能,以及更低的延迟。 画质方面,运用OBS分别对DLSS和原生画质中止高码率录制。从下图对比能够看到,开启DLSS方式的画质(下图左半部分),以至比原生分辨率(下图右半部分)的纹理细节愈加明晰。 据了解,截止11月15日GeForce RTX 4080发布时,将已有10款DLSS 3游戏发布。如《瘟疫传说:安魂曲》、《光明记忆:无限》、《消灭全人类2:重新探测》、《阴影火炬城》、《逆水寒》、《生死轮回》、《漫威蜘蛛侠:重制版》、《微软模仿飞行》、《超级人类》。WRC Generations, 《极 品飞车:不羁》和 《战锤40K:暗潮》三款支持DLSS 3的游戏也将在RTX 4080推出后不久发布,圣诞节前玩家就可畅玩这些DLSS 3游戏。 05/ 消费力表示 除了游戏以外,往常从游戏主播、内容创作者,到视频编辑、3D 建模和渲染等消费力工作,也没有一样离得开 GPU 的性能支持。 在渲染才干方面,我们先盘绕 Blender Benchmark 中止,在 Moster、Junkshop、Classroom 按个场景中,iGame GeForce RTX 4080 16GB Neptune OC相对 GeForce RTX 3090 Ti 至多提升了 52% 的性能。 同样 V-Ray 5 Benchmark 中,会同时考验到 GPU CUDA 性能和光线追踪性能表示,能够看到iGame GeForce RTX 4080 16GB Neptune OC相对 GeForce RTX 3090 Ti的RTX渲染效率效率提升了38%。 在SPECviewperf 2020集成的8款工业软件测试中,iGame GeForce RTX 4080 16GB Neptune OC相比RTX 3090 Ti也是全面抢先。 Octane Render RTX 经常被用作于场景建模,特别是开启光线追踪之后,对实时预览性能以及渲染输出都有着极高的请求,与 GPU 以及 GPU 的 RTX 性能直接挂钩。在这一项目中,iGame GeForce RTX 4080 16GB Neptune OC相对 GeForce RTX 3090 Ti 性能提升 30% 以上。 视频内容创作方面,在运用达芬奇渲染同一段4K H.265视频的任务中,iGame GeForce RTX 4080 16GB Neptune OC也比RTX 3090 Ti快了20%以上。 同时,GeForce RTX 40系列显卡还初次参与了 AV1 双编码器。AV1 编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟 AOMedia 所推出的免费编码格式,在国内曾经取得了哔哩哔哩、爱奇艺支持。它的特性是能在相同文件体积下具有更高清的画质,或者相同明晰度的画质下具有更小的体积。 下图是AV1(左)和AVC(右)的画质对比。 GeForce RTX 40系列显卡是目前市面上较少能够支持硬件AV1渲染加速的GPU,实测渲染导出同一段AV1视频,其效率对比纯CPU软件编码效率高了4倍左右。 与此同时,对游戏主播而言,GeForce RTX系列显卡支持的Broadcast工具还能够一键完成人像跟踪、视频去噪、噪音和回声消弭、消弭/虚化背景等适用功用。 06/ 功耗、散热与超频 运用Furmark对iGame GeForce RTX 4080 16GB Neptune OC中止10分钟满载压力测试。功耗稳定在380W左右,此时中心温度仅低至56.8°C,表示相当冷静。 这么强悍的散热表示,再分离前文提到的,这款显卡在高性能BIOS中还能够一键解锁470W的TGP,不得不让人想要手动超频试试了。 笔者很轻松地将显卡的中心加速频率拉到了3GHz,显存物理频率从1400MHz拉到1600MHz,此时3D Mark TSE跑分超越了1.5万分,相比公版频率的1.37万分提升幅度约10% 在《赛博朋克:2077》4K DLSS 2光追超级画质下,平均帧率也从64帧提升到69帧,游戏中低于60帧的状况更少了,效果还是挺明显的。 超频后运转游戏的实践功耗也仅仅不到350W而已,就轻松完成了远超RTX 3090 Ti显卡450W功耗下的性能,可见RTX 4080 16GB的能效比相当出色。 更重要的是,在这样一番幅度不小的超频过后,iGame GeForce RTX 4080 16GB Neptune OC还能以99%的稳定度经过3DMark TSE的20轮压力测试,可见这张显卡的散热关于超频玩家都是绰绰有余啊。 不外需求留意的是,我们察看到超频后的烤机功耗曾经来到了450W左右,所以关于超频玩家而言,保险起见还是倡议要在官方指导的750W电源规范上再加一些,选配不低于850W的电源。 07/ 总结 RTX 4080 16GB显卡再次展示了RTX 40系强大的能效表示,它仅以300W左右的功耗就完成了超越上代旗舰450W功耗下的性能,一定成为4K级发烧玩家的新宠。而作为首批旗舰非公型号,iGame GeForce RTX 4080 16GB Neptune OC这款显卡颜值出众,它强大的散热表示和超频才干也令人印象颇为深化。 测试过程中我们也进一步看到,往常高端卡的一个显著特征就是好卡也要配好U,否则显卡表示很容易受处置器单核性能缺乏的桎梏。但高性能的CPU同样会作为机箱内不可忽视的发热大户,这种状况下风冷显卡还总免不了让CPU“吃尾气”,为了更高的散热效率,又不得不迫使玩家加装更多的风扇,招致整机噪音增加。所以关于预算富余的玩家而言,无论如何折腾机箱的风道组建,可能都不如来上这么一款高端的水冷非公体验好。 据悉11月16日晚10点,七彩虹将在京东、天猫、抖音、快手等电商平台及线下受权批发经销渠道正式以现货出卖或预售的方式同时上架多款iGame、战斧GeForce RTX 4080显卡,包含 iGame GeForce RTX 4080 16GB Vulcan OC、 iGame GeForce RTX 4080 16GB Neptune OC、 iGame GeForce RTX 4080 16GB Advanced OC、iGame GeForce RTX 4080 16GB Ultra OC及战斧GeForce RTX 4080 16GB 奢华版,感兴味的话能够去了解一下。 |