12月1日RTX 3060 Ti性能解禁,随着60型号的发布,NVIDIA RTX 30系显卡从入门到旗舰级产品曾经补全,横跨整个四季度的显卡新品发布,让喜欢DIY硬件的玩家过足了瘾。今天我们为大家带来的是耕升GeForce RTX 3060 Ti显卡评测。 本次解禁的RTX 3060 Ti则比较不按常理出牌,首先“60 Ti”这个型号自常规系列的GTX 760 Ti之后就没有呈现过(16系显卡除外),能够说近两年的甜品显卡“Ti”这个后缀十分稀有,其次假如呈现Ti作为后缀的状况,依照以往的惯例也应该是先发布旗舰产品,如GeForce RTX 2080 Ti。 在公版评测中想必大家也曾经分明RTX 3060 Ti的性能,超越RTX 2080 SUPER并且在价钱上与RTX 2060相同,真香就完了。在评测开端前,笔者为大家总结一些该显卡的特性,也方便大家有针对性的阅读:
总的来说耕升GeForce RTX 3060 Ti 追风坚持了公版的性能,并在散热表示上加以改进,外观则坚持着追风系列一向的作风。 耕升GeForce RTX 3060 Ti追风 在性能表示上,耕升GeForce RTX 3060 Ti追风岂但在2K分辨率下能够做到更高帧率的运转,以至在4K分辨率下的部分游戏也有不错的表示,突破了人们对甜品卡性能缺乏的印象,加之超高的性价比,这款RTX 3060 Ti完整能够满足绝大部分游戏玩家的需求。 01 耕升GeForce RTX 3060 Ti追风外观 首先还是先来看外观,我们本次评测的耕升GeForce RTX 3060 Ti追风坚持了该系列一向的作风,简单硬朗的线条装点整体卡身。 耕升GeForce RTX 3060 Ti追风 耕升GeForce RTX 3060 Ti追风显卡的整体尺寸为315×125×49mm,相对其他30系显卡来说更小巧,厚度也更薄。显卡正面采用三个90mm风扇主动散热,内部为第二代风盾散热器,采用加大面积铜散热底座,并掩盖大面积散热鳍片以快速导热。 耕升GeForce RTX 3060 Ti追风背板 耕升GeForce RTX 3060 Ti追风的背板尾部采用镂空设计,能够让热风疾速穿透散热鳍片以及背板,令显卡温度进一步降落,另外在背板靠近芯片部位也有散热孔设计,以便发热严重的元件能快速散热。 耕升GeForce RTX 3060 Ti追风视频接口 视频输出接口上,耕升GeForce RTX 3060 Ti追风采用DP 1.4a*3 HDMI 2.1的4接口设计,另外新的HDMI 2.1接口可支持单线8K的视频输出。 耕升GeForce RTX 3060 Ti追风供电接口 在供电接口上,耕升GeForce RTX 3060 Ti追风采用了单8pin供电,而且由于RTX 3060 Ti的自身功耗较小,实测满载功耗仅为200W左右,外接供电的150W加上板子的75W,依旧是有富余的。 02 NVIDIA Ampere架构下的RTX 3060 Ti 耕升GeForce RTX 3060 Ti追风采用了NVIDIA Ampere架构,我们首先来看一下RTX 3060 Ti的提升。 第一代RTX架构 Turing下的RTX 2060 SUPER 第二代RTX架构 Ampere下的RTX 3060 Ti 相较于初代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3060 Ti中依旧有表示,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060 Ti的着色器性能抵达16.2 TFLOPS单精度性能,而Turing为7.2 TFLOPS。 NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core抵达31.6 RT TFLOPS,而Turing为21.7 RT TFLOPS。 全新的Tensor Core可自动辨认并消弭不太重要的DNN权重,处置稠密网络的速率是Turing的两倍,算力高达129.6 Tensor TFLOPS,而Turing为57.4 Tensor TFLOPS。 RTX 3060 Ti采用GA104中心具有174亿个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,另外在RTX 3060 Ti中我们都知道依旧采用了GDDR6显存,不外不同于RTX 3080的Micron,RTX 3060 Ti采用了三星的GDDR6显存。 我们在发布会中经常听到性能翻倍的说法,其实是由于本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这就使得每个SM的FP32运算单元数量进步了一倍,同时吞吐量也就变为了一倍。 而通常我们计算显卡的CUDA数量,并不是把SM中的一切单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。 RTX 3060 Ti共有4864个CUDA,其实它有2432个INT32单元,但由于内部的FP32数量翻了一倍,所以最终完成了4864这个惊人的数字。 而这样粗暴的提升CUDA数量关于游戏其实有着十分大的辅佐,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需求混合运用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。 光追工作原理表示 在此次的NVIDIA Ampere架构中,NVIDIA官方宣布为第二代RT Core,它和第一代有什么不同呢。首先要知道RT Core的工作原理是,着色器发出光线追踪的央求,交给RT Core来处置,它将中止两种测试,分别为边疆交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersection testing)。基于BVH算法来判别,假如是方形,那么就返回减少范围继续测试,假如是三角形,则反响结果中止渲染。 而光线追踪最耗时的正是求交计算,因而,要提升光线追踪性能,主要是对两种求交(BVH/三角形求交)中止加速。 RT Core的变更 在Turing的RT Core中,能够每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块,这样做的目的是为了提升诸如运动含糊特效时分的光线追踪性能。 运动含糊渲染原理 第二代RT Core能够让光线追踪与着色同时中止,中止的光线追踪越多,加速就越快,它将光线相交的处置性能提升了一倍,在渲染有动态含糊的影像时,依照NVIDIA自己的实测,比Turing快8倍。 稠密深度学习 Tensor Core能够看作是GeForce RTX GPU上的AI大脑。可加速用于深度神经网络处置功用的线性代数,这是现代AI的基础。例如用于AI超分辨率的NVIDIA DLSS和用于AI增强的声画处置技术NVIDIA Broadcast应用。 在本次的NVIDIA Ampere架构的Tensor Core也得到了极大地增强,在第三代Tensor Core中,NVIDIA引入了稠密化加速,可自动辨认并消弭不太重要的DNN(深度神经网络)权重,同时依然能坚持不错的精度。 首先原始的密集矩阵会经过锻炼,删除掉稠密矩阵,再经过锻炼稠密矩阵,从而完成稠密优化,进而进步Tensor Core的性能。 与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G以至百G的装置空间,关于存储空间的担负暂且不提,但寄存在硬盘中的数据,假如显卡想要读取到,需求先由CPU从硬盘中读取紧缩过的数据,经过解紧缩再发送到显存中。 固然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写关于CPU是极大的担负。 传统的数据交流 在这个过程中,会占用多个CPU中心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过紧缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。 RTX IO能够极大解放CPU担负 当然这项技术作为系统底层的运转方式改动,还需求借助微软发布的DirectStorage来完成,关于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时分,这项技术将会发挥庞大的效果。 同时搭配新增的HDMI 2.1接口,能够支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,假如想要衔接8K电视,则需求更多的线缆支持。 03 3DMARK 理论性能测试 首先引见一下测试平台,为了保障此次评测能够发挥耕升GeForce RTX 3060 Ti追风显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,细致如下。 在测试成果上,基准测试采用3DMARK,游戏性能测试运用游戏自带Benchmark,同时为了减小误差,每项测试成果均测试3遍取平均值。 GPU-Z参数 首先看一下GPU-Z的参数,软件更新到2.36曾经能够正确显现中心并修复了纹理单元辨认错误的状况。RTX 3060 Ti采用GA104中心,三星8nm工艺,芯片面积392平方毫米,具有4864个CUDA,耕升GeForce RTX 3060 Ti追风的频率与公版相同为1410-1665MHz。采用8GB GDDR6显存,位宽为256bit,显存带宽抵达了448GB/s,光栅单元和纹理单元为80和152。 下面先中止的是用来权衡显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实践测试结果如下: 3D MARK FS套装测试 在针对显卡DX11性能的3DMARK FS套装测试中,我们主要对比耕升GeForce RTX 3060 Ti追风和RTX 2080 SUPER,整体来看各项成果中均小幅抢先RTX 2080 SUPER;各项成果差值在1-4%之间。 3D MARK TS套装测试 而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,耕升GeForce RTX 3060 Ti追风抢先RTX 2080 SUPER更多,在TSE成果中抢先8%。 3D MARK 光追测试 PortRoyal是3DMARK中特地针对光追性能的测试项,耕升GeForce RTX 3060 Ti追风的测试结果要优于RTX 2080 SUPER,但幅度不大为3%左右。 在理论测试中,耕升GeForce RTX 3060 Ti追风能够说是RTX 2080 SUPER的OC版,固然提升不大,但我们时辰不要遗忘,两款显卡差了2000多元。 04 游戏性能测试 在游戏性能测试中,我们选择了《古墓丽影:阴影》、《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:奥德赛》、国产游戏《边疆》、《光明记忆:无限》的benchmark跑分软件。 另外在游戏测试中,由于显卡驱动的版本更新和游戏更新十分影响游戏帧数,一切benchmark跑分红果均以本次成果为准。 《古墓丽影:阴影》游戏测试 《古墓丽影:阴影》游戏测试 由于本次的参测显卡比较多,而古墓丽影分为规范测试和光追DLSS效果的测试,故分为两张表格中止对比,共2组6测。第一组为预设最高画质下,RTX OFF/DLSS OFF;第二组为预设最高画质下,RTX 超高/DLSS ON。 其中不难看出RTX 3080依旧遥遥抢先,耕升GeForce RTX 3060 Ti追风也要小幅抢先RTX 2080 SUPER的分数,但是差距不大。 《德军总部新血脉》游戏测试 《德军总部新血脉》由于自带两个benchmark,所以我们的数据取跑分均值。耕升GeForce RTX 3060 Ti追风相较RTX 2080 SUPER在1080P分辨率下提升7%,2K分辨率下提升16%,4K分辨率下提升4%。但从如此规整的等差数列中,不难发现RTX 3080原本不应该是这个水平,其中不知道是驱动问题还是游戏更新所致。 《刺客信条:奥德赛》游戏测试 接下来是《刺客信条:奥德赛》,其中耕升GeForce RTX 3060 Ti追风比RTX 2080 SUPER在1080P分辨率下分数高2%;2K分辨率下高4%;4K分辨率下高9%。 《孤岛惊魂5》游戏测试 《孤岛惊魂5》同样算是优化比较到位的3A大作,耕升GeForce RTX 3060 Ti追风比RTX 2080在1080P分辨率下分数高2%;2K分辨率下高14%;4K分辨率下高18%。 《光明记忆:无限》游戏测试 《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不外benchmark的跑分软件官方曾经提供,玩家能够在steam上自行下载。另外我们在测试的时分由于无法关闭光追选项,故一切测试成果均为“RTX 最高/DLSS 质量”方式下中止。 这款benchmark跑分软件在光追效果最高的状况下,运用了多种光线追踪技术,所以即便强如RTX 3080在4K分辨率下也只能跑到35帧。 《边疆》游戏测试 《边疆》同样是一款来自柳叶刀工作室的国产3A大作,细致出卖日期不明,目前仅提供了benchmark跑分软件。同样的目前跑分软件不支持关闭光追选项,所以在测试时我们选择“RTX 最高/DLSS 性能”下中止。 05 温度与功耗测试 在温度功耗测试方面,室温24℃,我们并没有采用全封锁式的机箱,而是采用测试平台的措施,这样做能够最大限度的保障显卡除了自身散热外将风道等外因减小到最低。 功耗测试(点击查看大图) 功耗测试中,我们选择FurMark软件中止拷机测试,功耗仅计算显卡自身。作为一款甜品级显卡耕升GeForce RTX 3060 Ti追风的功耗要小得多,在峰值状况下整体平均在200W左右。 温度对比 温度方面,本次的耕升GeForce RTX 3060 Ti追风温度相对公版低了7-8℃,出色的散热设计在10多分钟的拷机中,温度坚持在67℃。 06 部分游戏光追效果展示 上面我们测试了部分游戏的光追和DLSS性能表示,这些效果细致在游戏中是什么表示,下边笔者选择了两款游戏给大家展示一下。 《碉堡之夜》RTX ON(点击查看大图) 《碉堡之夜》RTX OFF(点击查看大图) 碉堡之夜的光追效果还是比较明显的,其中参与了反射、全局照明和途径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在翻开光追后更为写实,另外认真看的话远处建筑物的玻璃同样有光线的反射,整体画质改善十分明显。 《魔兽世界9.0》RTX ON(点击查看大图) 《魔兽世界9.0》RTX OFF(点击查看大图) 第二组对比来自最新的《魔兽世界9.0》,同样作为一款卡通渲染的网游来说,魔兽的年代愈加久远,此次参与光追效果在整体视觉上没有碉堡之夜明显。不外如远处的树木阴影,以及近处石台下方的阴影都比较明显。 《控制》RTX ON(点击查看大图) 《控制》RTX OFF(点击查看大图) 第三组对比为《控制》游戏,这款游戏所采用的引擎物理效果十分出色,同时光追开关的对比也是肉眼可见的明显。包含玻璃上的人物反光,远处空中的植物反光都比较明晰,同时翻开光追后屋顶处的明暗对比也愈加明显。 07 软硬兼施 铸就Ampere 好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成能力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项十分值得大家关注。 NVIDIA Reflex 以往我们关注延迟大多从显现器上了解到几毫秒极速响应,但那只是作为最终端的显现输出效果,你能否想过从系统内部到实践看到的画面有多大延迟? NVIDIA Reflex 在20系显卡中NVIDIA重复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显现器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。 以往假如想丈量系统延迟需求高速相机以及定制的LED鼠标电路。而运用带有NVIDIA Reflex技术的显现器将内置精确的延迟剖析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不外就像图中所示,为此你需求一个支持反射延迟剖析的鼠标。 NVIDIA Broadcast NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需求任何的背景布置,只需求一个普通的摄像头和一张GeForce RTX系列的显卡即可。 它戳我脸! 这款软件能够让你杂乱无章的房间立刻变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功用。NVIDIA Broadcast的工作原理是应用AI算法经过DGX超级计算机深度学习而来。 NVENC编码 同时RTX 30系显卡具有目前最好的硬件解码器,大部分用户的电脑在直播时翻开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码能够极大地减轻CPU担负。 NVIDIA Studio 关于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着衔接创作软件和显卡功用的关键。 NVIDIA Studio NVIDIA Studio驱动经过更新与优化,关于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功用。应用NVIDIA CUDA技术,GPU加速特效可完成更快的实时视频编辑并加速渲染输出,并让原本只能中止软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包含自动标记片段、特效追踪和人脸辨认等功用,都有显著的速度提升。 以GPU渲染为14.98秒 而CPU渲染为11分钟 当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有十分亮眼的表示。不只能提供强大且稳定的运转环境,更能以GPU加速,有效提升创作效率。 01 耕升GeForce RTX 3060 Ti追风外观 从性能上来说,RTX 3060 Ti给了我们足够的精密,作为一款甜品卡,原本以为只是能超越RTX 2070 SUPER的性能,没想到一举超越了RTX 2080 SUPER,并且在售价上坚持了与RTX 2060相同。 而这其中的区别不只仅是价钱,全新的NVIDIA Ampere架构采用了第二代RT Core和第三代Tensor Core,在光线追踪和AI学习方面都有不同水平增强,还具有更高的能耗比。 另外从游戏方面来说,这款甜品卡同样有着十分恐惧的性能,完整能够满足在2K分辨率下的高帧率游戏体验,以至大部分游戏在4K分辨率下也能够保障60帧的流利运转。 耕升GeForce RTX 3060 Ti追风 个人以为耕升GeForce RTX 3060 Ti追风完整能够满足绝大部分玩家的日常需求,不论是深度办公、后期剪辑还是3A游戏,都能有出色的表示。特别关于游戏玩家来说,作为甜品卡的RTX 3060 Ti在现阶段畅玩任何3A大作都不成问题。 |