RTX3090 性能极致炸裂的超级怪兽-Seaway作品测试

Seaway作品测试RTX3090显卡测评

RTX3090 性能极致炸裂的超级怪兽

嗨，大家好，我是Seaway，我们又见面了，再次受到BlenderCN社区邀请让我来测评本年度的超级核弹RTX3090。

前提声明

我不是显卡专业人士，也不是科学家更不是数学家，我只是一个民间草根，以下测评的数据只是基于自己的作品测试而得。一些非常细微的感觉，我无法通过具体专业的数据描述，只能使用一些形容词来表述，还望见谅。

还是和上次测试RTX2080一样，测试的方向是RTX3090在3D艺术创作中的生产能力。以下的测评虽然场景文件都是极端的设置，但渲染参数方面我并没有一味的开高某个参数，来得到一些不实际的测试结果，因为我的测试是基于自己实际创作流程为基准，是要把它运用到自己实际创作中的。

RTX3090为谁而战

在2013年NVIDIA推出了泰坦显卡，主要运用于人工智能以及深度学习研究人员和开发人员，这些创造性的应用需要泰坦显卡提供的额外更多的显存，以满足高端创意所需的大显存需求，NVIDIA在听取反馈意见后，为我们带来了RTX3090。

RTX3090是为高性能的内容创作、高负荷的数据科学研究，想要体验8K游戏的人们量身定制。无论是专业数字艺术家还是追求极致品质游戏和视频创作的爱好者，RTX3090都能为你提供强大、稳定、高效的核弹级性能。

在创作领域RTX3090具有24GB快速GDDR6X的超大显存，为你追求极致性能，用于大型模型、详细场景和高分辨率纹理的艺术创作保驾护航。在专业图像软件运用中RTX 3090提供的性能比RTX 2080 Ti和TITAN RTX高出33％-105％。而且由于RTX 3090具有24 GB的超大显存，它可以处理的数据集的大小是RTX 3080的两倍。并且RTX3090仍然支持NVLink，这让你可以挂接更多RTX3090来进一步提升更强劲的性能。

另外，作为全球首款8K HDR游戏GPU，RTX 3090支持你在绚丽的8K HDR中进行游戏、捕捉和观看游戏，拥有用于8K游戏的全新DLSS超性能模式（DLSS Ultra Performance）、配备可单线连接8K电视的HDMI 2.1、支持能够进行8K HDR游戏捕捉的GeForce Experience，以及用于高效播放8K HDR流媒体视频的AV1解码。RTX 30系列GPU是首批支持硬件加速的AV1解码以实现流畅8K 60 FPS播放的GPU，与现有的H.264、H.265（HEVC）、VP9解码器相比，效率更高。AV1将播放高分辨率视频所需的带宽降低了多达50%，使其成为下一代4K和8K HDR Youtube视频的理想选择。

NVIDIA Studio 驱动

你可能会奇怪，我为何在这里要说驱动？硬件之上需要软件适配，硬件的功能得以施展必须配备最优化的驱动，不然硬件虽然参数强大，但是实际上跑起来坑太多，根本没法投入生产，那时候后悔就晚了，不过有了NVIDIA的studio驱动就完全不担心这些问题。

NVIDIA在今年8月推出了NVIDIA Studio 驱动，此驱动程序专为创作者构建，它服务于数字艺术创作软件，包括Adobe Premiere Rush、Premiere Pro、Blender Cycles、V-Ray 5 for Maya、Flicker Free和BorisFX Optics等等。所以，你使用RTX显卡(包括GTX10系列)作为生产力硬件的话，强烈推荐安装NVIDIA Studio 驱动，这样你的显卡会以最佳性能为你服务。

可以访问这里了解更多详细内容：https://www.blendercn.org/9659.html

*至于使用RTX显卡的Blender用户就更加-必须–马上更新了，因为NVIDIAOptiX渲染引擎与Blender的Cycles紧密联系在一起，

这会让Cycles享受到RTX强大的加速buff，RT Core加速光线追踪和Tensor Core加速的AI降噪功能。

*使用RTX30系列的小伙伴请务必更新最新的10 月 Studio 驱动。不然Cycles的动态模糊无法使用OptiX加速。RTX30系列显卡也无法提供最佳性能。

注意！顺序可别搞错了，先安装RTX显卡，然后再安装NVIDIA Studio 驱动。

可以通过 GeForce Experience或 NVIDIA 驱动下载页面下载最新的10月 Studio 驱动 (456.71)。

测试平台：

测试软件：Blender 2.90 正式版（对比RTX2080会比较公平。）

测试主机：（由BlenderCN社区裴雪珂老师提供）

显卡 Nvidia RTX3090 24GB （显卡驱动更新到官方推荐的 256.71）

AMD Ryzen 3900X CPU

96GB　DDR４内存

BIOSTAR 512GB M.2硬盘

显示器X2 分辨率：1920X1080

操作系统：Win10 64位教育版

机箱：爱国者黑曼巴 F1 风冷散热

电源：750W

好，说完前面这些，我们正式开始本文。请出今天的主角RTX3090！

在收到显卡后我并没有急着测试，而是特意到官方查询了RTX3090的参数，把我关注的技术参数列在下面。

NVIDIA 架构：Ampere

GA102-300-A1核心

CUDA核心数量：82组SM单元共计10496个流处理器

第2代RT Core 82个提供20Giga Rays/s

全新第3代Tensor Core 328个

显存配置：24 GB GDDR6X

显存位宽：384Bit

最高 GPU 温度：93℃

显卡功率：350w（电脑电源最低要求750W）

虽然我在没有拿到显卡前就梯子到油管上看了人家的测评，让自己心里有个准备，但是实际测试还是让我吃惊不小。

房间光线暗，手机拍照效果一般，小伙伴们凑合看吧，哈哈

哼哼~~~你们的新老婆在我手上！

再看看RTX20….突然~~~不！不！不！我不能喜新厌旧，我不能喜新厌旧，我绝对不是那种人~~~~~~

这次官方的造型设计，个人非常喜欢，整体造型非常酷，做工精细，非常有感觉。

当然这新老婆分量也很十足，大概有6公斤重！！！把它塞进机箱我折腾出一身的汗，哈哈。

再来两张微距细节

在散热方面我在这里就直接说自己测试后的感受了：( 注：全部测试都是机箱闭盖环境下完成，没有任何开盖的情况！)

昆明这几天阴雨，房间温度20摄氏度左右（看来天公作美，给予这显卡自然降温buff，哈哈）。

RTX3090使用了双风扇导流设计，一个在正面，一个在背面，并且在尾部（DP接口面）也有自己的散热口，这样能很好的给显卡散热，不光如此，还能对机箱整体内部做散热，在测试的这段时间中，RTX3090温度控制非常好，观察到最高温度77度，但也只是一瞬间，平均在68~74度之间，渲染速度没有非常明显的影响，这个比起RTX2080要优秀很多。

好，我们进入实际测评：

*以下测试全部为极端数据，且为个人作品测试数据和对比，故只作为娱乐参考，不能作为权威测评。

*测得的渲染时间我都按四舍五入的方式统计。

*注：与RTX2080做对比有些不公平，没办法只有RTX2080的测试数据，只好委屈下2080了，哈哈

关于渲染分布块大小与渲染速度：

我分别测试了256×256、512×512、1024×1024、2048×2048

最佳还是推荐512×512，1024块要慢几秒，256块和512差不多，但渲染画幅尺寸过大，256还是不-推-荐。

测评第一个作品：凯普巨人殖装胸像

关于凯普装甲文件在上篇RTX2080有详细介绍，这里就不再重复了，可以访问RTX2080测评了解。

https://www.bilibili.com/read/cv6952550

视口显示，雕刻细节全开9级，面数3600万，文件起始内存占用9.6G，显存占用4.9G

Blender2.90正式版，Cycles渲染器

采用块分布式渲染，块大小：512X512，开启OptiX 后期降噪：Color+Albedo+Normal

视口实时渲染：

首次Cycles渲染加载场景耗时1分20秒，3600万面数，大概0.5秒成像，2秒不到细节全出，4~5秒细节进一步精进，8秒基本已经完事了，后面就是按照你指定给Cycles的采样再更加精细而已。这个作品对于拥有24G显存的RTX3090来说轻松应对，在Cycles开启后，快速切换全屏，反应速度非常快，RTX2080要慢一些。具体可以看我后面的参数对比图。

推荐观看操作视频，这个最直观让你感受RTX3090的强大能力。

https://www.bilibili.com/video/BV1hZ4y1V7CV?p=1

100采样基本就是10秒，特意截这图，这就是10秒后的品质，已经非常棒了。

视口实时渲染的一个对比图

RTX3090 VS RTX2080 视口实时Cycles渲染

注：此测试时间只针对此案例，不同场景内容会相应加减时间。

EEVEE视口实时：

这个其实没有啥测试的必要，因为RTX2080就已经毫无压力了，RTX3090更是轻松应对。

加载不到1分钟，拖动视口和编辑Mesh都毫无压力，EEVEE视口实时能力我在后面准备了一个更加对胃口的案例，所以不在这多说。

EEVEE最大的不足就是阴影和折射

接下来是重头戏，成品渲染测试：

这次我一上来就直接测试8K的，尺寸：8640X4800 170块采样：200 渲染时间：6分13秒（RTX2080渲染时间：47分25秒）

瓦特！6分13秒！！？？你不信是吧，连我都不信，时间出来我都懵了，RTX2080用了47分钟，这家伙6分钟就完事啦！！？？

于是我连续重渲了三遍，分别为：06分12秒、06分14秒、06分13秒。

测到这里，老实说心里真是有些激动，这渲染速度实在让人不要太舒服。

这里截取第四次渲染的过程（这四次是连续渲染），可以看到前面有一个06：14（四舍五入）的时间。

好，来看下其他几个尺寸的时间：

没有开启OptiX加速的CUDA渲染成图的时间：

图片尺寸：3600X2000 32块采样：350 渲染时间：4分34秒（RTX2080渲染时间：17分13秒）

开启OptiX加速渲染成图的时间：

图片尺寸：3600X2000 32块采样：350 渲染时间：2分01秒（RTX2080渲染时间：5分43秒）

图片尺寸：5040X2800 60块采样：300 渲染时间：3分06秒（RTX2080渲染时间：10分39秒）

别急，后面才是主菜：

10800X6000 264个分布块，采样：200 渲染时间：9分35秒（RTX2080渲染时间：1小时42分09秒）

1万像素只需要9分半钟，渲染了3次，都是9分30秒~9分35秒。这个实在是太香了啦，哈哈

1万像素，1：1局部截图

来看看渲染时间对比图，没有对比就没有伤害，一下子RTX2080就真的不香啦，哈哈

图为不专业的我花了一下午整出来的，不要扣细节，时间是真的，柱状图绝对有误差，看个明白就好。

测评第二个作品：春蝶入芳夏（素模版）

文件介绍：

灯光22个，一部分是动态雕刻，一部分是精雕后减面的模型，还有曲线模型总共300多个部件，600万面数，模型大部分是没有UVmap的，全部材质是用程序纹理和纹理贴图混合得到的材质，运用了大量的程序节点完成，还有运用了VertexColors。

这个案例侧重于Cycles成品渲染和动态模糊的测试。

先来看看成品渲染：

6480X6480 169个分布块采样：300 渲染时间：5分38秒（RTX2080时间：14分09秒）（RTX2070s时间：41分57秒）

（注：这里的RTX2070s的渲染时间不是非常准确，渲染后期降频很严重，渲染时间过长，这里列出来也只是一个参考。）

8640X8640 289个分布块采样：200 渲染时间：6分24秒

10800×10800 484个分布块采样：200 渲染时间：13分02秒

10K 1：1 局部截图，可以看到纹理的细节呈现非常好。（注:面部材质细节为纯程序纹理节点组 ）

渲染时间对比

OptiX加速 Cycles 运动模糊：

这次显卡驱动更新中有一个重要的更新，就是OptiX对运动模糊渲染的支持。

这个能力不是只有30系列有，20系列也支持，快去更新显卡驱动吧。（GTX10系列不知道是否支持）

需要注意的是：

1运动模糊无法再视口中预览，必须成品渲染才可看到。

2 在首次渲染时，会出现一个编译过程【Loading render kernels (may take a few minutes the first time)】，耐心等待它的完成，之后你就可以在运动模糊渲染中使用OptiX加速了。

这里放上自己的动态模糊测试对比图。

可以看到，开启运动模糊和不开启在时间上差距不大，并且品质很好，这要比通过后期使用Vector通道得到的效果精确。

测评第三个作品：炽天使跑车场景

文件介绍：

原来参加Substance Painter比赛作品，拥有32张贴图，其中8K的有12张左右（具体记不清了，都是从Substance中输出的。）这个作品非常适合HDR环境照明下的实时光照渲染。这场景虽然对象不多，面数也不复杂，但地面是细分置换修改器得到的高精细地面，还有非常复杂的多张8KMask贴图混合而成的材质结构。

这场景在RTX2080上渲染前加载数据使用了1分34秒，然而在RTX3090下只需要41秒左右，差不多快了50多秒的时间。因为RTX3090的位宽是384bit的，对数据加载的速度要优于RTX2080许多。

好我们来看测试截图，（注：截图左上角文件名称带有RTX2080字样请无视，绝对没有造假）

Cycles的实时视口渲染：

HDR全环境光照效果，视口移动毫无压力，车体质感非常好。

这个在RTX2080就完全没有任何压力，RTX3090就更是轻松至极了。反应速度和成像速度都极为迅速。

在切换加载环境HDR贴图到成像的速度上，RTX3090要比RTX2080快一些，RTX2080大概在1秒，RTX3090大概在0.5秒。

还是推荐看视频演示吧，无法码字描述，原谅我墨水已干。（先声明：视频没有任何加速）

https://www.bilibili.com/video/BV1hZ4y1V7CV?p=2

EEVEE视口实时显示：

场景加载和贴图加载只需要41秒左右，比RTX2080快很多，2080大概在1分15秒才能加载完成。

大家自己看视频吧，反正我也只能用牛！快！这些来形容，或者噼咔噼咔，咔嚓咔嚓（看不懂吧！异乡人！去找派蒙给你翻译下）

https://www.bilibili.com/video/BV1hZ4y1V7CV?p=3

最后和小伙伴们分享下自己对Bender的EEVEE引擎和Cycles渲染器的一点看法：

EEVEE的优点不必说，这里说说我遇到的一个问题：

在模型很多，面数超高，材质节点结构也非常复杂的情况下，EEVEE视口更新是有明显延迟的，视图拖拽和材质编辑视口都会有明显的卡顿。一旦场景中材质和模型发生“结构编辑性”改变，它必须重新计算场景和材质，而根据场景对象和材质复杂程度，重新计算加载的时间也会变长（Cycles也会重新计算，但相比之下速度超快）。当然更新速度在RTX3090中有很明显的提升，但卡顿，延迟还是存在。所以EEVEE引擎适用于游戏级模型、单体复杂的模型展示和成套的PBR材质流程场景，一次完成加载，没有修改直接展示。而成品渲染方面，品质和速度面对拥有OptiX的Cycles来说几乎没有优势。（以上只是提出一种观点，希望EEVEE能更好的解决复杂情况的能力。现在EEVEE其实是没有得到显卡很好的加速支持的，不过也许在不远的未来…我很期待）。

再来看看现在的Cycles渲染器，精确的全局渲染，精准的光线追踪，细腻的光影，丰富的通道和matte，随着NVIDIA带来的RTX加速技术，Cycles最致命的缺陷“渲染慢”的短板彻底解决了，基本上成像预览都像开了挂一样秒出，所以如果你对画面有很高的要求，大场景，超高面数对象和复杂光影和材质编辑的话，Cycles+OptiX是你的最佳首选。当然不光是Cycles，Vray、Keyshot、OctaneRender等等也同样享受RTX的加速技术。

最最后分享几张截图结束我们这次的测评吧~~~~~

以下均为视口实时截图，猜猜看，他们是cycles还是EEVEE所为。

总结

RTX3090说实话已经非常接近自己心里的完美了，个人测试下来总的感觉就是稳定，快速高效，温度控制很好，而且渲染时风扇噪音也不大，24G大显存让RTX3090可以胜任超多对象面数的复杂场景，比如城市，森林，战场这些都能很好的发挥它强大的性能。对于Blender而言，RTX3090是一个极其强劲的战力伙伴，而这只是起点，因为NVIDIA和Blender基金会的合作仍然在继续，再未来将会带来更多惊喜。

如果说RTX2080是飞机的话，RTX3090就是火箭了，你想体验极致游戏的同时又想拥有超强的创造性能，那RTX3090是本年度最佳选择，它是极致游戏体验与超高效生产力完美并存的超级怪兽，无语伦比的性能实在无法用言语和文字来表达，RTX20系列完成了质的一次转变，而RTX30系列在此基础上又飞跃到了一个让人惊叹的高度。RTX30系列开启了一个全新图形生产阶段。无论在游戏娱乐，艺术创作，shader编写，逼真的视觉开发都带来了前所未有的效率和品质。所以，这不是一款普通的显卡，而是会带来革命性开启新纪元的超级怪兽。

朋友！

欢迎来到新数字视觉纪元

RTX3090