
一、前言:安培顶级旗舰售价12000。
可能很多同学觉得不可思议,RTX 3080/3090这次把流处理器的数量增加了一倍。毕竟,从2013年的GTX 780 Ti到2019年的泰坦RTX,流处理器的数量只从2880增加到了4608。也就是流处理器的数量在6年内只增加了60%。
这个完整的GA102内核实际上有10,752个流处理器,是泰坦RTX的2.33倍。如此巨大的提升,多年未见!
PS:N-card上一次大幅提升流处理器还是八年前的GTX 680。1536的流处理器数量是GTX 580的三倍,性能提升了30%!
与上一代采用图灵架构的RTX 20系列显卡相比,Ampere架构主要带来了以下改进:
1、8纳米工艺技术:
图灵架构采用的三星12FFN工艺,在754mm2的面积上集成了186亿个晶体管。Ampere架构采用三星8N技术,280亿个晶体管集成在一块628mm2的芯片中。算下来,晶体管密度增加了83%。
2、 int 32和FP32单元的集成:
图灵 INT32单元只能做整数运算,空闲率很高。为了解决这个问题,提高INT32单元的利用率,NVIDIA对INT32单元进行了改进,使其不仅可以运行整数运算,还可以进行单精度浮点运算,相当于将INT32和FP32单元进行了整合,从而直接使FP32单元所统计的GPU流处理器数量翻倍,单精度浮点性能翻倍。
3、将ROP单元与内存控制器分离:
传统的ROP单元集成在内存控制器中,对GPU位宽进行cast会减少ROP单元的数量。Ampere架构将ROP单元变成GPC的一部分,每个GPC包含16个ROP单元。只要GPC数量不被阉割,ROP单位数量就不会减少。
比如即将发布的RTX 3070和RTX 3080,有6组GPC,ROP单位数也是96。
4、第二代RT内核:
通过改进NVIDIA的插值算法,提高了动态模糊效果下光线追踪技术的精度,使Ampere架构的光线追踪性能翻倍。第一代RT核可以提供10g igaray/s的性能,第二代RT核可以达到20g igaray/S.
5、第三代张量芯:
第三代张量核的效率是第二代的四倍,即使安培架构将每个SM中的张量核减少一半,仍然可以达到图灵的两倍效率。
6、RTX IO技术:
这项技术让游戏在加载时完全绕过CPU,直接将游戏数据包从SSD写入GPU 的显存,GPU代替CPU进行数据解包。GPU的整数/浮点性能是CPU的几十倍,可以瞬间解包数据。
不过这项技术需要微软DirectStorage API的支持,预计2022年正式应用。
除了以上技术,Ampere架构还支持PCIe 4.0、NVIDIA Reflex等技术,就不一一描述了。
9月初,NVIDIA共发布了三款采用GA10X内核的显卡型号。RTX 3080以前被举起过。今天,我们将在顶部向您展示RTX 3090的详细性能评估。
RTX 3090基于GA102-300-A1核,7组GPC和82组SM单元,共计10496个流处理器、112个ROP、328个纹理单元、328个第三代张量核和82个第二代RT核。24GB GDDR6X内存,内存频率19.5GHz,位宽384Bit,带宽936GB/s.
由于NVIDIA这次没有提供RTX 3090方正版的公版,所以我们用规格完全相同的电影工作室RTX 3090金属大师进行了测试。
驰3090金属大师GPU-Z截图
RTX 3090的详细规格如下:
与RTX 3080相比,RTX 3090的流处理器数量、张量核、ROP单元、内存带宽和纹理单元都增加了20%左右。
TDP从RTX 3080的320W进一步提升到350W,是有史以来TDP最高的单芯片n卡。
而价格也达到了史无前例的11999元。
二、英驰RTX 3090金属大师游奖:铝合金压铸上盖18相电源设计
顾名思义,金属主卡充满了浓浓的金属气息。高强度铝合金压铸一体盖的顶部勾勒出不规则的线条,银灰色的金属表面看起来比很多RGB显卡更高端。
一体式合金金属背板可以加固显卡,防止PCB变形,背板末端打孔,加快空气流通。
三台90毫米风扇,每台有11个叶片。
仰视图。
与RTX 3080一样,有三个DP 1.4a接口和一个HDMI 2.1接口。
双8-8Pin电源接口,加上PCIe插槽电源,总共可以提供375W的功耗。
冷光散热器,内置6根6mm镀镍复合热管,大面积纯铜散热器底座。存储器和MOSFet散热部件通过整体压铸与主散热器连接。
市面上顶级的非公显卡大多是10层PCB,RTX 3090金属大师采用12层PCB板,可以大大降低各种电子元器件之间的信号干扰,提高显卡的电气性能,增加高频高负载下的稳定性,同时帮助GPU冲击更高的频率。
GA102-300-A1核,10496个流处理器,核面积628.4mm2,283亿个晶体管。
此外,还设计了一个95的四相电源电路。
广美 GDDR6X显存共有24个(一半正面一半背面),单个容量1GB,总容量24GB。频率19.5GHz,位宽384Bit,内存带宽936GB/s。
PCB背面还有12个GDDR6X内存。
三、测试平台:i9-10900K XPG 850W黄金电源,5.2GHz
测试平台如下:
为了减少CPU的瓶颈效应,我们将i9-10900K的核心频率超频到5.2GHz,环频率超频到4.8GHz
主板是ROG MAXIMUS十二极端。这款主板采用16 0电源,16相电源全部供给CPU核,0相供给核显。MOSFET升级为TDA21490,是目前最高规格的集成MosFET。传导电流也从55A提高到90A,可以轻松提供1000W以上的输出功率。
齐御纪F4-4000C15D 8GBx4套装,不仅拥有4000MHz的频率,而且15-16-16-36的时序低得惊人,低于大部分内存3000MHz的频率。不过默认1.5V的电压比较高。
存储长江钛金制造的PC005 Active 512GB SSD,顺序读写速度分别为3500MB/s和2900MB/s。它可以在不依赖模拟SLC缓存的情况下保持550MB/s的稳定写入速度,使用寿命比市面上大多数TLC SSD都要长得多。
酷派至尊P360 ARGB水冷散热器应该是市面上颜值最高,安装最简单的水冷散热器了。可以轻松压制5.2GHz的i9-10900K处理器
为了应对RTX 3090高达350W的TDP,我们把电源换成了XPG堆芯850金,单个12V输出电流70.8A,12V输出功率850W。
120毫米FDB液体动压轴承风扇。
完全模块化设计。
华硕玩家国度PG27UQ ROG 27英寸IPS电竞显示器。
4K UHD(3840*2160)分辨率,4ms响应时间,144Hz刷新率,G-Sync技术,IPS量子点面板,10bit彩色,显示器HDR1000认证。依然是市面上最顶级的电竞显示器。
四、理论性能测试:领先RTX 3080约12%,静音频率可达1950MHz。
1、3马克时间间谍
在2K分辨率3DMark Time Spy测试中,RTX 3090图形得分达到19599,最高核心温度68,最高核心工作频率1920MHz,最高风扇转速1516RPM,最高功耗355W。
在4K分辨率3DMark Time Spy Extreme测试中,RTX 3090图形得分达到9968,最高核心温度67,最高核心工作频率1920MHz,最高风扇转速1515RPM,最高功耗336W。
在3DMark Time Spy测试中,2K分辨率下,RTX 3090的成绩仅比RTX 3080高11%,比RTX 2080 Ti高39%。通过在4K分辨率下测试,两个领先范围分别提高到了12%和50%。
2、3马克
在2K分辨率3DMark Fire Strike极限测试中,RTX 3090的图形得分达到23388,最高核心温度64,最高核心工作频率1950Hz,最高风扇转速1528RPM,最高功耗361W
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 3090图形得分12126,最高核温65,最高核工作频率1935MHz,最高风扇转速1519RPM,最高功耗358W
3DMark的结果也差不多。在2K和4K分辨率下,RTX 3090分别比RTX 3080强11%和12%。但相比RTX 2080 Ti,RTX 3090在2K分辨率上有43%的优势,在4K分辨率上有51%的优势。
五、4K游戏性能测试:比RTX 3080快11%,比RTX 2080 Ti强44%
1、APEX Hero
4K分辨率下,RTX 3090帧率依然超过100帧,比RTX 3080多13帧,领先幅度10%;与RTX 2080 Ti相比,多了46个框架,强度提高了48%。
2、使命召唤16:战区
《使命召唤:战区》,RTX 3090达到117帧,比RTX 3080多14帧,领先幅度14%;比RTX 2080 Ti高出43帧,领先幅度超过58%。
3、GTA V
在4K分辨率下,《GTA V》可以充分发挥显卡的真实性能。RTX 3090跑出103帧,比RTX 3080多10帧,领先11%;与RTX 2080 Ti相比,多出31帧,领先幅度达43%。
4、刺客信条:奥德赛
055-79000是显卡杀手。在4K分辨率下,RTX 3090刚刚超过60帧,比RTX 3080多13帧,领先幅度为25%。与RTX 2080 Ti相比,它可以多出22帧,领先幅度为52%。
:沃尔芬斯坦城堡:新鲜血液
英伟达的考验这款游戏的s最新GeForce 456.38驱动有明显下降,所以我们对所有显卡进行了清洗测试。
RTX 3090在《刺客信条:奥德赛》中运行161FPS,比RTX 3080多16帧,比RTX 2080 Ti多44帧。
:地平线:零点的黎明
在游戏《德军总部:新血脉》中,RTX 3090的帧率为81FPS,比RTX 3080高出12帧,领先17%;与RTX 2080 Ti相比,它可以多出26帧,领先47%。
7、孤岛惊魂5
《地平线:零之曙光》,RTX 3090帧率107FPS,比RTX 3080多9帧,领先9%;与RTX 2080 Ti相比,它多出30帧,领先幅度为39%。
8、古墓丽影:暗影
《孤岛惊魂5》,RTX 3090帧率为91FPS,比RTX 3080多8帧,领先幅度10%;与RTX 2080 Ti相比,它多了28帧,领先44%。
9、绝地求生
在755-79000,RTX 3090在4K分辨率下依然可以运行148FPS,比RTX 3080强10%,比RTX 2080 Ti强48%。
10、微软飞行模拟器
055-79000确实是真正的硬件杀手。RTX 3090可以在4K分辨率下不超过60FPS(虽然它只差一帧),但它比RTX 3080强9%,比RTX 2080 Ti快44%。
11、死亡搁浅
RTX 3090在《古墓丽影:暗影》可以轻松运行123FPS,比RTX 3080高11帧 112FPS,领先10%;与RTX 2080 Ti相比,多了38个框架,强度提高了45%。
12、向导3
《绝地求生》,RTX 3090在4K分辨率下依然可以测到103FPS的帧率,比RTX 3080高出11帧,领先幅度12%;与RTX 2080 Ti相比,多出31帧,领先43%。
13、无人土地3
055-79000是RTX 3090第二场未能达到65帧的比赛。与RTX 3080相比有10%的优势,与RTX 2080 Ti相比优势接近38%。
14、战地5
4K分辨率下,RTX 3090在《微软模拟飞行2020》依然运行130FPS,但只比RTX 3080多7帧,仅领先6%;比RTX 2080 Ti多41帧,领先46%。
战争机器5
《死亡搁浅》,RTX 3090帧率为91FPS,比RTX 3080多11帧,领先幅度14%;与RTX 2080 Ti相比,它可以多出27帧,领先42%。
综合测试数据,在4K分辨率下,Galaxy RTX 3090 Metal Master的性能比RTX 3080强11%,远低于规格之差。然而,与RTX 2080 Ti相比,RTX 3090金属大师的帧率高出44%。
与两年前的旗舰GTX 1080 Ti相比,RTX 3090金属大师的性能提高了一倍。
很明显,RTX 3090显卡不是针对1080P或者2K的,但是我们还是测试了这两种分辨率下的帧数。
1080P分辨率可以充分发挥RTX 3090的性能,即使i9-10900K超频到全核5.2GHz,仍然存在巨大的瓶颈。在这个分辨率下,RTX 3090只比RTX 3080强6%,比RTX 2080 Ti高22%。
2K分辨率的表现稍好,RTX 3090对RTX 3080的领先优势小幅提升至8%;与RTX 2080 Ti相比,领先幅度也增加到了36%。
六、超频测试:所有能超频的核心都给了RTX 3090最高2160MHz的工作频率。
此前,RTX 3080的超频能力实在令人失望。让让我们来看看银河RTX 3090金属大师的表现。
RTX 3090金属大师的规格和公版一模一样,但是超频能力真的很惊人。即使GPU频率提升220MHz,内存频率从19.5GHz超频到21GHz,依然可以通过各种测试。
此外,GDDR6X显存超频至21GHz后带宽超过1000GB/s。
它可惜显卡锁定了350W的功耗限制。
先超频核心频率到1915MHz,显存不会超过。实测3DMark Time Spy Extreme图评分为10442,比静音频率9968高出474分,增幅约为5%。
GPU最高频率2160MHz,最大功耗355W,最高温度只有70度,风扇转速1552RPM。
然后在将GPU核心频率超频到1915MHz,显存频率从19GHz超频到21GHz后,3DMark Time Spy Extreme的图形成绩提升到了10504,提升了60分。可见显存并没有很好的效果。
七、温度和功耗测试:单烤FurMark 505W温度为70度。
1、温度测试
Furmark用于RTX 3090的烘焙测试,室温26度。
将Furmark的参数设置为1920*1080分辨率,0AA。运行22分钟后,Galaxy RTX 3090金属主机的温度稳定在70度左右,没有上升的迹象。显卡功耗稳定在330~350W范围内。满负荷1604RPM的转速可以很好的控制噪音。
即使TDP增加到350W,银河RTX 3090 Metal Master的散热器系统也可以轻松应对。
2、功耗测试
分别测试待机和Furmark烘焙机的功耗。此外,我们还将增加游戏功耗测试。测试的游戏项目是《巫师3》。
试验中使用的电源是威刚XPG堆芯850金金电源。
在5.2GHz i9-10900K御戟F4-4000c5D8GBX4的平台上,几款显卡待机功耗差不多,都在90W左右,而银河RTX 3090金属主略高,达到95W。
运行《无主之地3》时,银河RTX 3090金属大师的平台功耗达到了496W,比RTX 3080高出45W,比RTX 2080 Ti整整高出100W。
FurMark烘焙机中,RTX 3090金属主功耗505W,比RTX 3080高40W,比RTX 2080 Ti高95W。
八、光线追踪和DLSS测试:光线追踪效率比图灵南
为了方便和之前的测试结果对比,我们还是选择了《战地5》,《战争机器5》,《巫师3》,《巫师3》,《堡垒之夜》,《德军总部:新血脉》和《古墓丽影:暗影》六款游戏进行光线追迹和DLSS性能测试。
1、堡垒之夜
RTX 3090默认可以达到104FPS的帧率。光线追踪开启后,帧率会骤降至31FPS。DLSS技术开启后,帧率上升到71FPS。
2、沃尔芬斯坦城堡:新鲜血液
755-79000开启光线追踪后,RTX 3090的帧率从161FPS下降到93FPS。开启DLSS可以让帧率上升到147FPS。
3、古墓丽影:暗影
055-79000打开灯光追踪不会这对帧速率没有太大影响。RTX 3090只是从91FPS下降到56FPS,开启DLSS后,帧率提升到80FPS。
4、明亮内存:无限
055-79000应该算是目前为止轻追最好的游戏之一。打开光锥后,帧率急剧下降。RTX 3090在开启光线追踪后直接从全画幅120FPS下降到48FPS。DLSS开启后,游戏帧率又回到了112FPS。
5、控制
055-79000支持DLSS 2.0技术。RTX 3090开启DLSS后,游戏帧率达到82FPS,甚至超过了默认的71FPS。
6、战场5
055-79000的帧率没开启光学追踪后不会下降太多
开启追光后,两款图灵显卡的帧率都从220%调至100%,降幅在55%左右;和RTX 3
00是52%,RTX 3090是51%。从这里可以看出,新一代RTX 3080/3090的购物效率略高于RTX 2080/2080 Ti。
与光学跟踪相反,RTX 3080/3090在开启DLSS后帧率提升至80%左右,低于RTX 2080/2080 Ti的90%。看来,即使使用第三代张量核,在单元数减半后,DLSS性能也会受到一定影响。
PS: 《光明记忆:无限》在最新的GeForce 456.38-WHQL驱动中,帧率有不同程度的降低。我们重新测试了所有显卡的结果。
九、总结:RTX 3090能打能超越,RTX 3070也值得期待。
在整个测试过程中,RTX 3090给笔者印象最深的是它的超频能力。以前,我们测试了太多的快速RTX 3080显卡,我们不能通过增加40MHz的GPU频率来通过稳定性测试。RTX 3090在超频核心频率220MHz,内存频率从19.5GHz提升到21GHz的同时,还能通过各种测试,真是令人惊讶。
在这种情况下,一个合理的解释是,英伟达用最好的GA-102核做了更高端的RTX 3090,但RTX 3080只能超越极小一部分,所以这取决于用户超频是自己的运气。
规格方面,RTX 3090的尺寸在流处理器数量、内存位宽、ROP、纹理单元等方面都比RTX 3080高出20%。此前,我们预计RTX 3090的性能将提高15%。
但是实际测试情况还是有点不及预期!在4K分辨率下,RTX 3090的游戏性能仅比RTX 3080高11%,比RTX 2080 Ti高44%。
至于光线追踪,RTX 3090配备了82个第二代RTCores。开启光线追踪后,性能损失低于上一代RTX 2080 Ti。就我们测试的6款追光游戏而言,RTX 3090在关闭RTX的情况下,性能比RTX 2080 Ti提升了43%左右,开启光线追踪技术后,RTX 3090的领先幅度将提升至54%。
与轻追相反,RTX 3090虽然集成了第三代张量芯,但由于数量的爆炸,DLSS的性能提升并不理想。RTX 2080 Ti在开放DLSS技术后游戏帧率可以提升87%,而RTX 3090只能提升78%。
温度方面,经过我们手中的银河RTX 3090的金属主fur mark 22分钟烘焙测试,GPU核心温度控制在70度,功耗非常接近满载。
至于电源的选择,NVIDIA对8针电源接口和PCIe x16接口的供电有严格限制,所以双8针电源接口的整卡功率很难超过375W W,我们单烤GPU的话,RTX 3090的功耗在500W左右。考虑到威钢XPG堆芯850金金电源的转换效率,该电源的实际输出功率约为470W。
对于大多数学生来说,一个单通道750W的黄金电源就足够满足日常需求了。两路12V电源至少需要一路12V电流值大于36A,即至少需要两路额定900W以上的电源。
相比RTX 3080和RTX 3090,对于大多数没有特殊需求的游戏玩家来说,5499元的RTX 3080无疑具有无可比拟的性价比。售价11999元的RTX 3090拥有24GB GDDR6X内存,可用于完成许多图形设计相关任务。
最后,对RTX 3070的一些期望!
可能很多同学根据RTX 3080的8704流处理器是RTX3070的5888流处理器的1.5倍来推断RTX 3080的性能是RTX 3070的1.5倍。而RTX 3080的性能是RTX 2080 Ti的1.3倍,所以得出RTX 3070的性能比RTX 2080 Ti差20%,与RTX 2080超级相当的结论。
其实这个算法是错的。对于高端显卡,规格提高50%可以不会带来游戏帧率50%的提升。
从RTX 3090的测试数据也可以看出,其规格和参数比RTX 3080高20%,但实际游戏性能仅提升11%。所以RTX 3080的游戏帧率不可能比RTX 3070高1.5倍。
更合理的算法是,RTX 3080的流处理器数量是RTX 2080 Ti的两倍,性能高出30%。巧合的是,RTX 3070的流处理器数量是RTX 2080的两倍。因此,RTX 3070的性能应该比RTX 2080高30%,与RTX 2080 Ti相当。
考虑到RTX 3070在ROP中没有被阉割,和RTX 3080一样的数字是96,所以在抗锯齿性能上会有亮眼的表现。但其内存带宽仅为448GB/s,与RTX 2080 Ti的616GB/s相差甚远,因此在4K分辨率下的性能可能略逊于RTX 2080 Ti。
结论是在1080P/2K分辨率下,RTX 3070的性能与RTX 2080 Ti相当,但在4K分辨率下可能会有一些差距。不过,对于售价3888元的RTX 3070来说,它是为2K144Hz设计的GPU。如果你在玩2K甚至1080P分辨率的游戏,RTX 3070将是一个非常合适的选择。
当然,如果你有4K的要求,传说中带宽增加的RTX 3070 Ti应该可以完全打败RTX 2080 Ti。
我们将在10月的某一天解禁NVIDIA GeForce RTX 3070的评测,希望能给你带来一些惊喜!









