ag平台百家乐 GeForce RTX 5080天梯榜首发评测: 超猛能耗比莳植极致尺寸

发布日期：2023-12-24 10:14 点击次数：139

RTX 5090 D和RTX 5080是同期开售的，不外它们的解禁时候不那么一样。前段时候咱们照旧评测了RTX 5090 Dag平台百家乐，今天咱们就来看一看次旗舰GeForce RTX 5080。迥殊值得一提的是，此次RTX 5080是有Founders Edition的——NVIDIA自家的缠绵向来自成一片，本次RTX 50系更因其相宜SFF-Ready（适用于SFF小尺寸）圭臬的超薄缠绵而惹人注目。讲真，我以致以为不少疼爱者会径直因为Founders Edition的这个尺寸跳过性能展示部分径直下单了，不外这倒不是不写评测到街上放烟花的事理。因此，接下来就让咱们充满有趣心，好好地看一下这张显卡内与外。

规格表

硬件架构解析

这里的架构解析主若是涵盖RTX 50系GPU的硬件方面，如果思要阅读包括神经网罗渲染、RTX Mega Geometry等本领的详备架构解析，请阅读RTX 5090 D的评测：《iGame GeForce RTX 5090 D Advanced评测：散热稳压大中枢,DLSS 4闻所不闻》

Blackwell GB203中枢：RTX 5080出场即满血

和上一代序列一样，轮到RTX 5080的等于GB203中枢了。完好的GB203中枢共领有456亿晶体管。前边在RTX 5090 D评测照旧说过，在Blackwell这一代上，如故GPC-TPC-SM层级缠绵。GB203共领有7 GPC，42 TPC，84 SM，10752个CUDA中枢——我思这里你能看出一丝辞别：何如TPC是42个？是的，天然目下咱们还莫得完好的中枢架构图，但是用简便的乘除法就知谈，GB203上每组GPC如故和前代一样包含6组TPC。不外有一个好音信是，此次RTX 5080出场即满血，这点跟它的前辈不一样。

在GPC段，可见它包含的TPC从Ada Lovelace的6组彭胀到了8组。不外布局上如故一样的，一个孤苦的光栅引擎，两个ROP分区（每个包含8个ROP单位），而每组TPC包含两组SM。

到达SM段，这里的变化是比较大的。最初，目下系数的32个CUDA中枢都能实际FP32/INT32运算了，因此INT32的算力可以说是加多了一倍。不外在一个时钟周期里面，中枢只可二选一运算，要不FP32，要不INT32。NVIDIA暗示这种缠绵是为神经网罗着色器优化的。Tensor Core和RT Core天然也有升级，不外让咱们先说完新的显存。

GDDR7显存：带宽高能耗低

RTX 40系上的GDDR6X是NVIDIA和好意思光协作打造的，因此你就只可在NVIDIA的产物上看到GDDR6X，而且部件号无一例外全是D8BZC，别无二家了属于是。在RTX 50系列这一代上，NVIDIA是和圭臬制定者JEDEC固态本领协会协作，推出了全新的GDDR7显存。

NVIDIA暗示，GDDR7显存聘请了PAM3调制，这能让它在信噪譬如面有所普及，通谈的密度也加多了。性能方面，GDDR7能带来更高的带宽，同期比GDDR6X/GDDR6要节能得多。

第5代Tensor Core：新增FP4维持

第5代Tensor Core领受了上一代架构的特色，并新增了FP4、FP6的维持，还把FP8 Transformer Engine更新到了第二代。

FP4维持显然是环球比较阵势的。NVIDIA对此的讲明是，跟着生成式AI模子能力的普及，老例的FP16模子对硬件迥殊是显存的条款有增无已，在单张显卡上运转这些模子会变得非常贫乏。而FP4模子需要的显存更小，在TensorRT模子优化器（Model Optimizer）的维持下还能作念到险些莫得质地亏本，对于系数这个词RTX 50系列来说是很友好的，毕竟不是每张卡都有RTX 5090 D那么大显存。

为什么要强调单张卡也可以运转呢？这其实跟游戏也关斟酌，在咱们之前的报谈里说过，NVIDIA一直在捣饱读NVIDIA ACE这个AI NPC本领，再加上别的基于AI的游戏本领也要用到Tensor Core，因此提高模子的运转效果很有必要。

第4代RT Core：为RTX Mega Geometry准备

在第4代RT Core上头咱们仍然能见到一些练习的组件，比如Box Intersection Engine和Opacity Micromap Engine这两个加快引擎，它们折柳针对BVH树遍历和透明物体进行加快。而新增的组件包括Triangle Cluster Intersection Engine和Triangle Cluster Compression Engine，以及Linear Swept Spheres。

AI-Management Processor和着色器实际重排序2.0

AI-Management Process（AMP）在架构图上和GigaThread Engine并排，可见它亦然个退换器。AMP的骨子是一个位于管线前端的RISC-V处理器，它维持Windows硬件加快GPU规划，能够更解放地管束GPU。

AMP相似跟AI游戏关联。这里举个例子，腹地运转LLM的话，它们初度反馈的时候一般是比较慢的，这放在常识库聊天机器东谈主里还好，环球可能都风气了，但是对于游戏来说，这等于另一种情景了：试思一下你掀开游戏加载归档，刚思找npc接个任务，闭幕npc憋了半天才冒出一句“你好”，这如实很结巴游戏体验。

同期运作的话，LLM的反馈时候变慢，游戏帧率也会受影响

而在AMP的维持下，CUDA、RT Core和Tensor Core三大部分可以妥协责任。如图所示，AMP提高了LLM的优先级，令其更早启动，作念到在游戏中实时反馈，并同期让游戏引擎、DLSS 4保捏矫健的帧率输出。

在Ada Lovelace上的着色器实际重排序（SER）主若是针对后光跟踪而缠绵的。通过对后光跟踪任务的动态重排序，该功能可充分提高硬件使用率。而Blackwell上的SER 2.0还可以将神经网罗的负载径直发送至Tensor Core处理，加快神经网罗渲染。NVIDIA暗示，Blackwell上的SER重排序逻辑效果达到了前代的2倍，责骂支出之余还能提高精确度。

DLSS 4：多帧生成还有模子升级

咱们终于说到DLSS 4了！说真话DLSS 3引入的帧生顺利能照旧挺让我惬心的了，而DLSS 4则是更进一步，带来了多帧生顺利能。这个我思应该毋庸过多讲明，等于渲染1帧最高生成3帧。另外，我在最近的Editor's Day上问过NVIDIA对于多帧生成极限的问题，他们暗示这AI模子是可以生成更多帧的，但是3帧是一个比较合理的值，因为DLSS 4是多个AI模子沿路责任的，是以工程师在缠绵时不只单要研讨帧生成的问题，再说了，生成3帧带来的普及照旧弥漫强力了。

接下来咱们就逐个拆分DLSS 4的各项组件，望望它们有什么更新，又是怎样协同责任。

最初是环球都关注的帧生成，NVIDIA Blackwell的帧生成模子比上一代快了40%，同期显存占用责骂30%。同期，用于提供光流场信息的不再是RTX 40系列上的光流加快器，而是一个更高效的AI模子。

不外如斯一来新的问题就产生了：在Ada Lovelace上，DLSS 3是渲染一帧生成新的一帧，等于帧1，1.1，2，2.1...这种，把控每帧的输出轨则如故比较容易的，因为生成的帧1.1总在渲染的帧1后头，如果来不足输出帧1.1，那就把它丢掉，径直输出帧2就好。而RTX 40系上的DLSS 4是1，1.1，1.2，1.3，2，2.1，2.2，2.3，3...，中间整整隔了生成的3帧，何如不让输出轨则乱套等于新的问题。为此，Blackwell引入了硬件级Flip Metering（这个名词如实很难描摹，直译是翻转测量），这个组件将帧平滑逻辑从CPU转化到GPU的涌现引擎上，让GPU更精确地掌控涌现每一帧的节律，责骂帧与帧之间的时候波动。开启后NVIDIA暗示，Blackwell的涌现引擎获取了两倍像素处理能力，这样就可以维持高分辨率、高刷新率下的Flip Metering。

由于DLSS 4多帧生成需要用到第5代Tensor Core的浩大算力去计较光流场和生成多帧，因此这个功能目下是Blackwell独占的。

然后比较让东谈主惊喜的是，超分辨率、后光重建、DLAA也获取了更新，它们的模子从CNN换成了Transformer，一个给与自刺见解机制的神经网罗，适用于从RTX 20-50的全线RTX GPU。不外我思在这里说明CNN和Transformer两个神经网罗有什么区别统统会喧宾夺主，光是编码器息争码器就够喝一壶的了。因此只需要知谈新的模子能够提高画面的矫健性，普及光照细节，赐与动态物体更多细节即可。大伙可以鄙人面的DLSS 4测试中非常直不雅地看到这两个模子的画面辞别。

NVENC和NVDEC新增Y′CbCr 4:2:2维持

目下许多录像机都维持录制4:2:2局势的视频，这是有原因的：4:2:2比拟起4:4:4更勤俭储存空间，但是比起4:2:0能保存更多的表情，这样一来就给后期调色留住了充足的空间。Blackwell此次新增了4:2:2的编解码维持，可提高创作家的效果，比如说导出时候减少，更指引的多路回放等。NVIDIA暗示，第6代NVDEC可同步解码和播放多达8个4K60 4:2:2视频流。

而第9代NVENC则普及了HEVC和AV1的编码质地，为4:2:2 H.264和HVEC编码提供了维持。另外，还有一个全新的AV1 Ultra High Quality（UHQ）模式，它可以用更多的时候去获取异常5%的质地普及。NVIDIA还暗示，这个模式在RTX 40系列上也可用，不外Blackwell的质地是更好的。

外不雅缠绵和里面

GeForce RTX 5080 Founders Edition给与了新的包装缠绵，与上一代的Founders Edition有所不同，从材质、结构和配色来看都非常绿色环保。让我思起了一些手机的包装盒。不得不说拆箱的时候挺有典礼感的，先拔掉高下两块固定板，就能把上盖拿起来，RTX 5080 FE就静静地躺在其中。

RTX 5080 FE保捏了公版显卡一向优秀的外不雅缠绵，一看这象征性的无尽象征外框就知谈是NVIDIA同族的手笔。金属材质不但面子，而且触感非常棒。全新的散热惩处武艺让新一代FE显卡的体态变得苗条，正面两侧是定制的大直径电扇，背面两侧布满了大面积的格栅，以归拢标的垂直成列。此次NVIDIA接纳了从GTX 10系列到RTX 40系列历代公版显卡在散热缠绵上的锤真金不怕火，在RTX 5080 FE显卡上引入了名为“Double Flow Through”的新款散热器缠绵，带来了更为高效的散热效果。

RTX 5080 FE显卡保捏了双槽厚度，长度和高度折柳为304mm和137mm，完全豪恣SFF-Ready圭臬的条款。如果与RTX 4080这些环球伙放在沿路对比，那么体积上的差距就很暴露了，迥殊在厚度上，RTX 5080 FE薄了许多。另外还能看到，RTX 5080 FE的12V-2x6供电接口给与了新的歪斜缠绵，AG百家乐为什么总是输视频接口也180°调转了，对于插线来说更为友好。同期因为散热缠绵的改动，I/O挡板莫得了启齿，尾部一体感很强。

和前几代一样，RTX 5080 FE的灯光除了在侧边的GeForce RTX接口外，还藏在了框架中间的X形处，启动时就会亮起白光，配合着整皆的格栅和平滑的外壳，可以说是是科幻又深奥。由于全新的散热缠绵，举座瘦身的RTX 5080 FE不需要显卡支架，也没在尾部留住螺丝孔，装在机箱里面很干净，莫得别的东西来侵犯它。

至于拆解的话，从性能影响的角度开拔，就算我个东谈主非常但愿能够一窥其里面分外小巧的三片PCB缠绵，也不太好把它逐件理会——毕竟难点在于后头的恢回答状，光有外不雅可不成，性能也得到位。不外还好，NVIDIA挑升出了一期聊Founders Edition散热缠绵的视频，从里面咱们能知谈这种不落俗套的结构是何如降生的（底下的截图援用自该视频【衔接】）。而咱们后头向NVIDIA说明了，因为总功耗更低，是以RTX 5080 Founders Edition给与的是老例均热板缠绵，导热材料是硅脂。不外热管数目倒莫得削减，亦然双方各5根。

测试平台

本次的测试平台和RTX 5090 D一样，以AMD 锐龙7 9800X3D和X870E主板为中枢，可确保显卡性能的全力阐述。说真话也莫得换平台的必要。至于对比显卡的话，此次就丰富多彩许多了，不仅有RTX 4080，还有AMD Radeon RX 7900 XTX，以致还有RTX 4090 D——它刚刚才在RTX 5090 D的测试里面亮相了，目下还要继续上班，就跟我一样。

而测试驱动则是Beta版的Game Ready驱动，不外因为测试的先后轨则问题，RTX 5080用的是572.02，其他的RTX显卡用的是571.86。系统则是最新版的Windows 11 24H2。在游戏记载数据这块，如果游戏自带Benchmark的话，咱们会优先聘请Benchmark提供的成绩；如果游戏需要手动测试，咱们会用NVIDIA Frameview去记载成绩。由于这张显卡的高端定位，游戏的援手都是预设的最高了，后光跟踪亦然，唯有游戏维持咱们都会径直开全景后光跟踪/旅途跟踪。

基准测试

来望望3DMark的数据先吧。RTX 5080在各方面都比RTX 4080好许多，算下来增幅有20%，研讨到AD103和GB203在鸿沟上的相似性，你可以苟简认识成这等于Blackwell的代际普及幅度。RTX 5080在4K分辨率的测试里面跟RTX 4090 D有着约10%的差距。和RX 7900 XTX对比的话，RTX 5080和它在传统光栅化性能上苟简是捏平的，不外光追性能等于另一趟事了，绿色小队在后光跟踪这块一直是BIG BOSS。

其实可以看到中枢鸿沟和基准测试的数据是很好对应的，RTX 5080的鸿沟差未几是RTX 5090 D的50%，那么在传统和光追测试里面的分数也这样，RTX 5080的分数条比RTX 5090 D的一半多一丝。天然，咱们也就在3DMark这里展示一下GB202和GB203的差距，游戏数据就不放了，毕竟这两张卡在成立和售价上完全不是一个级别的。

游戏测试

DLSS 4性能测试

在前些天的RTX 5090 D评测（还有上头的架构解析）里面，咱们照旧先容了DLSS 4的特色，因此在这里咱们就尽量不妥复读机了。提及来，《赛博一又克2077》前几天崇拜推送了DLSS 4更新，如果你照旧在用RTX显卡的话，目下是可以亲躯壳验DLSS 4里面的全新Transformer模子的——涵盖超分辨率和后光重建。天然，多帧生成仍然是RTX 50系显卡的专属功能。

此次咱们一共测试了三款游戏，包括游戏内集成DLSS 4的《赛博一又克2077》和《星球大战》，以及通过NVIDIA App优设功能兑现DLSS 4的《漫威争锋》。天然咱们目下测试的DLSS 4游戏数目是有限的，但当你们收到RTX 50系显卡的时候，应该就会有许多游戏获取原生DLSS 4或通过NVIDIA App的DLSS优设维持了，NVIDIA暗示首日维持的游戏和期骗数目会多达75款。

可以看到在全景后光跟踪开启且DLSS 4全开的情况下，《赛博一又克2077》和《星球大战：漏网之鱼》从不可玩现象径直冲到了三位数帧率。迥殊是《星球大战：漏网之鱼》，在DLSS 3里面平均帧率只达到90fps，在多帧生成的维持下，就能冲上120乃至160fps的岑岭！而延长的话就更毋庸惦记了，的确不成的话你也可以开3x多帧生成，归正此时帧率照旧很够了。

至于Transformer和CNN新旧模子的对比上头，咱们就径直援用RTX 5090 D测试时的截图了——因为新模子是从RTX 20-50系都能用的，是以你就算拿一张RTX 3080，用和咱们相似的援手也能获取这种对比颇为暴露的画面（天然，帧率细目没那么高）。底下系数的对比截图均是在超分辨任性能挡获取的，屏幕分辨率为4K，图形援手为后光跟踪超速。可以看到Transformer大幅度地改善了复杂场景里面的细节进展，比如门板夹层的金属部件、水面倒影和调料瓶瓶盖。

CNN模子CNN模子Transformer模子Transformer模子

4K分辨率

在老例游戏测试这里，咱们守护了和RTX 5090 D相似的游戏威望。一共有7款光栅化游戏和6款光追游戏参加4K分辨率的测试，至于参加2K分辨率测试的游戏就少点，是光栅化游戏和光追游戏各4款。毕竟RTX 5080是一款定位4K分辨率的显卡，前者才是重心。

在原生4K分辨率游戏这块，RTX 5080在数个式样中都理所天然地超越了RTX 4080。在一些式样中，RTX 5080以致能贴近上一代旗舰RTX 4090 D，比如说在《极限竞速：地平线5》和《赛博一又克2077》这两款游戏中，这两张卡基本莫得区别。和RX 7900 XTX对比的话，RTX 5080也在大部分游戏里面超越了这张RX 7000系列最佳的显卡。

4K光追游戏这块，虽说咱们是有测试RX 7900 XTX的，但是它的成绩都太低了，一些全景光追游戏对它来说根蒂吃不用。因此咱们就只可鄙人面的2K分辨率里See you again了，目下来专心看几张RTX显卡的对比。获利于第四代RT Core，以及更多的RT Core数目，RTX 5080比起RTX 4080有着卓越15%的普及！天然，RTX 4090 D的鸿沟比RTX 5080大许多，是以它是力大砖飞，光追成绩比RTX 5080好也可以认识。不外别忘了，RTX 5080有多帧生成这一个好意思妙兵器，可以让光追游戏的帧率成倍高涨。

2K分辨率

因为分辨率的责骂，是以可以看见几张显卡的差距都有所削弱。不外比举例故如4K分辨率那般，RTX 5080的光栅化游戏性能在RTX 4090 D和RX 7900 XTX之间，卓越RTX 4080不少。光追的话亦然如斯，RTX 5080在三张RTX显卡里面排行第二。

AI与分娩力测试

AI生图与谎言语模子

获利于Blackwell添加了对FP4的维持，在UL Procyon FLUX.1 AI生图测试里面，RTX 5080在FP4模式下仅用了10秒不到就生成了一张图，所用时候连RTX 4080的1/3都不到。在FP8模式中，RTX 5080也比RTX 4080快，不外差距小一丝。

天然，老例的UL Procyon Stable Diffusion FP16咱们也会测试。可见在这里RTX 5080仍然是要比RTX 4080快，在条款更高的Stable Diffusion XL中，RTX 5080生图时候暴露比RTX 4080裁减。研讨到咱们是用ONNX DirectML运转时测试的，若是Tensor RT日后崇拜更新了对RTX 50系列的维持，随机这生成时候还要短许多。

在LLM测试里面，RTX 5080在和输出Token速率这些环节决议上都比上一代快10-15%。

分娩力创意软件

V-Ray和Blender都是跟3D创作关联的软件，在这里你可以看到RTX 5080是怎样为创作提速的。在V-Ray 6 Benchmark中，RTX 5080要比RTX 4080快20%。

温度测试

丰足说这一代Founders Edition的尺寸如实是一件颇为令东谈主恐惧的事，因此咱们对它的温度进展天然很感风趣。咱们是在绽开平台测试RTX 5080的散热。测试分为待机和满载两个场景。待机场景是干涉系统后待机5分钟，而满载场景则是3DMark Speed Way运转10分钟。咱们用GPU-Z的Log to file功能记载数据，环境温度是24.4摄氏度。经由测试，RTX 5080 FE的满载温度矫健在了68摄氏度高下。待机温度方面，则是由31.4逐渐高涨到34.4摄氏度，和其他带智能启停的显卡一样。研讨到这只是是一个2槽位显卡，这成绩挺可以的。

功耗测试

咱们通过手中的PCAT套件，折柳精确地测量显卡PCIe、外接电源接口的功耗，显卡满载功耗在3DMark Speed Way压力测试中获取，待机功耗则是在干涉系统跋文录1分钟取平均值。测下来显卡的平均满载功耗达到了328W，峰值功耗的话，图里面是358W，不外记载数据里面最高有366W的记载，只是图里面刚好莫得阴私良友。而待机功耗绝大部分时候是在15W以下。总的来看是比RTX 4080/4080 SUPER这一代高了少量。电源推选方面，其实NVIDIA官方建议的850W是够用的。

杂音测试

在GPU-Z的Log to File中咱们同期记载下了显卡转速情况。烤机时，RTX 5080电扇转速最高的时候在1550RPM高下。接着咱们把显卡放进了环境杂音小于10 dB(A)的消音实验室，把其电扇还原相似转速，然后在30CM的距离上测试其杂音水平，测得的数据是42.5BA。由于显卡在待机时电扇是停转的，是以就毋庸测试了。

回来

可能是由于早些时候的RTX 5090 D带来的冲击，加上数日来不分日夜的捏续测试，说真话RTX 5080给我带来的触动其实莫得RTX 5090 D那么横暴。然则必须要刺目到的是，比拟起鸿沟暴涨的GB202，RTX 5080的GB203在组件的数目上和AD103更相似，在探讨架构代际普及这个话题上，RTX 5080是更有代表价值的。从游戏测试里可以看到，RTX 5080在光栅化和光追游戏性能上都是稳步普及，DLSS 4更是让其如虎添翼。个东谈主认为，如果你还在停留在RTX 30乃至20系旗舰的话，RTX 5080如实可以让你一步进步，直抵4K。而对于刚买了RTX 4080和RTX 4080 SUPER的玩家而言，他们随机可以松语气，天然DLSS 4的确作念到了四倍增幅，但DLSS 3的双倍真是也不赖了。

不外，我信服有这样一群玩家是最思要GeForce RTX 5080 Founders Edition的：他们同期追求体积的极限压缩和性能的闻所不闻，如同《核舟记》的奇巧东谈主一般，要在小空间里描摹大天下——对于这群ITX玩家而言，这一代Founders Edition统统是最佳的礼物。迥殊研讨到这几代以来，高端显卡只大不小的趋势，NVIDIA能提倡SFF-Ready圭臬何况身膂力行，作念出这样一张双槽猛兽，如实称得上是历史挪动。

显卡迷你天梯榜（完好显卡天梯榜）

终末，如故说一说售价，GeForce RTX 5080 Founders Edition的价钱为8299元，相较RTX 40系发布时RTX 4090和RTX 4080时过于临近的订价，RTX 50系此次旗舰的凹凸搭配如故比较合理的。如果你只是拿来玩游戏ag平台百家乐，那RTX 5080如实是很可以的一张高端显卡。

上一篇：ag平台百家乐干事导向游戏有哪些最热干事导向游戏名次

下一篇：ag平台百家乐环球第一台可推广光量子诡计机问世：35颗光子芯片、13公里光纤