如何评价英伟达9月2日凌晨发布的30系列新显卡？-轻识

↑ 点击蓝字关注极市平台

本文整理自知乎问答，仅用于学术分享。如有侵权，请联系后台作删文处理。

编辑｜极市平台

极市导读

就在今天，NVIDIA创始人黄仁勋正式发布了新一代RTX 30系列显卡。这三款显卡的性能均超过上一代旗舰产品，预计将于9月中旬陆续发售，可谓“千呼万唤始出来”！其中，RTX 3070、3080的售价分别仅为499美元和699美元，性价比十足。而售价高达1499美元的RTX 3090，则拥有10496个CUDA核心，配备24GB GDDR6X显存，号称“世界上第一款8K游戏显卡”。

那么，专业人士如何评价新一代显卡？本文精选知乎相关话题的优质回答，相信能让你更好地了解30系列。

评价一

作者丨sumomo tsuru

看完发表会，真香是真香，但难受的是，最近买了两张TITAN RTX，49年入了国军。还买了张5700XT，摔。

补充一张图：

TITAN RTX才4608个CUDA。

国区价格也非常香

这张图真是清楚明了。3080达到了4.5倍980的性能，但价格只有699美元起，如果以2080对比，快2倍性能提升，真是映证了摩尔定律。3070也非常的香，2070S的价格2080Ti的性能，三分之一的预算就能获得20系最顶级的游戏体验。

散热系统也极其友好，对于多卡系统来说简直是福音，通过涡轮风扇减少一部分积热的同时，又最大化的利用了机箱风道，特别适合一体式水冷系统。比20系那套简单的下压式不知道高明了多少。

唯一的遗憾就是3080只有10GB显存，老黄的刀法依旧犀利。

3090其实没有比3080强太多，但24GB的显存让真正的高端玩家只能花两倍的价格体验8K游戏，赤果果的价格歧视。

至于炼丹，先等等新一代TITAN吧，看Ampere架构这么厉害，新TITAN估计能到32/48GB显存，性能超过V100吧。

经评论区补充，以及查看Ampere的架构，30系的CUDA算法应该是把FP64算成2个FP32，所以比20系多了一倍。实际上3090有82个SM，每个SM有64个FP32，也就是说FP32的CUDA数是5248。而3080的FP32 CUDA是4352，3070是2944。2080TI的FP32 CUDA数是4352。但新加入的FP64核心也确实让30系的单位SM性能提高了将近70%（3070约等于2080TI），很厉害。另外，评论区也有猜测是直接把FP32数量翻倍，这也是很有可能的。

再补充：老黄真的把30系架构里面每个SM里面的CUDA数翻倍了。这应该是上一代在SM加入Tensor Core之后对SM又一次大的调整。另外30系这样的规模和价格，也有可能是对抗可能出现的XE_hpg。毕竟4tile的XE_hp浮点都有A100两倍多了。

来源：

https://www.zhihu.com/question/418916610/answer/1448377959

评价二

作者丨小萌猫

这次老黄堆料堆得太狠了，疯狂塞cuda+扩充显存，当然付出的代价就是功耗爆炸。

对于游戏玩家而言，秒2080Ti的3070恐怕是最香的，正如这哥们说的那样：

但是对于很多机器学习研究者来说，1499刀，11999人民币的3090才是真的香，因为搞过图像训练的都知道这对显存的要求非常苛刻，24G DDR6X的显存，一万多的CUDA核心，这比卖两千多刀的TITAN RTX要香太多。。老黄结结实实地在用硬件推进机器学习啊！

此外，别指望资本家突然大发善心，给你们推出一堆香饽饽，逼着老黄踩牙膏的一定是竞争对手。所以等吧，AMD这次一定也非常惊艳，3090的水平当然不用去想，不过中档卡可以去期待一下的，能不能香过老黄我不知道，静待佳音~

来源：

https://www.zhihu.com/question/418916610/answer/1448394725

评价三

作者丨Ryan Woo

看完发布会，感觉这代显卡应该会成为类似于Pascal 那样的经典：

前面不少朋友提到了这代直接的运算性能提升，作为基本只用显卡玩游戏的人，从买菜的角度简单分析下，买菜的都知道，你肯定希望用合适的钱买性价比最高的菜，但是如果同一棵菜只是包装好一点，你往往不用花多出来的钱去买个包装。所以用到选显示上，你只需要关注核心数目就几乎等同于线性提升的游戏性能。但是花哨的RGB，风扇，官方超频就是那些没太大意义的“包装”。在使用同一块核心的显卡中，买最便宜的那块。这种选择往往是性价比最高的。

我们先拿上一代Turing 的几个显卡作为比较：

RTX 2080 Ti 使用的核心是 TU102，拥有 186亿个晶体管，Cuda 运算单元：4352，价格 $1200

RTX 2080 使用的核心是 TU104，拥有 136亿个晶体管，Cuda 运算单元：2944，价格 $800

所以 2080 Ti 比 2080 贵了50%，晶体管多了37%，但是也提供了48%多的运算单元

而站在买菜的角度，这两个完全不是同样的菜，他们用了完全不同的核心，所以无论是性能提升还是价格提升都有迹可循，同时也因为使用了不同核心，一块流片作废的 TU102 核心几乎没有任何用途（RTX Titan 也是TU102核心，但是核心更多），这完全是高风险，高成本。而流片作废的TU104可以废物利用屏蔽几个核心拿去做成 2070 Super，2070 Super 移动版，或者降低频率做成 2080 移动版，这妥妥的资金回流，超低风险。

所以某种程度来说，玩家买 2080 Ti 是个“并不坏”的选择，你确实一分钱一分货的买到了好产品。根据前面的前提，你其实是花 2080 Ti 的钱享受了 RTX Titan 级别的大部分游戏性能。

同样的类比可以用在后来发布的 Super 上面，同样使用了 TU104 核心的 2070 Super 就比使用 TU104 的 2080 和使用 TU106 更低一档次的 RTX 2070 性价比显得更高。而那些买了 RTX 2080 Ti的人，根本都不会多看 2080 Super 一眼，核心 Size 决定了差距不可能靠超频弥补。

再看一下 Ampere

RTX 3090 使用的核心是 GA102，拥有 280亿个晶体管，Cuda 运算单元：10496，价格 $1500

RTX 3080 使用的核心是 GA102，拥有 280亿个晶体管，Cuda 运算单元：8704，价格 $700

3090 价格比 3080 贵了114%，但是核心是一样的，所以晶体管数目一样，仅仅只多了 20% 的运算单元，甚至连电源需求都是一样的。

如果我们暂不谈显存容量，单从芯片构成来说，3090 与 3080 的对比非常像 2080 super 之于 2070 Super——使用的同一块芯片，阉割下20%运算单元。但是2080 Super 只比 2070 Super 贵$200 ，而3090 可是贵出了一倍有余...

所以你多付出一倍多的成本，几乎全部化为买显存芯片，这24GB的显存也就只有夸张的8k游戏是刚需。而$1500 与 $700 巨大的价差让我几乎可以肯定未来会有 3080 Ti，核心比3080多解锁 10%，显存控制在合理的 12GB，价格定到$999，之所以现在不卖，是因为可以作为对抗AMD big navi 性能和宣传战的武器，就像当初等着RX 5700 发布才发布的20x0 Super 系列一样。

所以从买菜的角度看，可以想像成用了同一个种子，区别就是有机还是无机栽培罢了——3090 和 3080 你买的是同一块芯片，实际性能差别从理论值推算应该只有10-20%，但是价格贵了一倍多，所以这卡性价比并没有 RTX 3080 璀璨夺目。如果你真要怼我说 RTX 3090 比 RTX 3080 8k下面快100% 我也无话可说，毕竟爆显存后的性能劣化根本就没有多少讨论的意义，就像当初 1080 Ti 号称 4k 下面跑45 fps 比 980 Ti 爆了显存后只能跑15 fps 一样毫无意义。更何况，买得起 8k 显示设备的人，根本不在乎多买两块 RTX 3090 SLI...

但是如果你换个角度，RTX 3090 这卡其实并不完全是为游戏玩家设计的，它的真的市场是游戏之上，学术科研之下的 Titan，众所周知，Titan 系列就是得益于巨大的显存成为深度学习的翘楚，而对于前一代Titan $2500的高昂售价, Volta V100 $10k起的价格，3090 24GB 显存 $1500 突然变得和蔼可亲了。

再多提一句 RTX 3070，虽然它的风光完全被 3080 盖住了，这块卡将会是非常不错的中端销量王：

RTX 3080 使用的核心是 GA102，拥有 280亿个晶体管，Cuda 运算单元：8704，价格 $700

RTX 3070 使用的核心是 GA104，拥有 170亿个晶体管，Cuda 运算单元：5888，价格 $500

所以 3080 比 3070 贵了40%，晶体管多了64%，也多了 48% 的运算单元，性能堪比上一代 2080 Ti，继续上演当年 Pascal 1070 战翻 980Ti 的辉煌。也成为不错的老卡升级选择，从9系，10系，和 AMD 过来的玩家，直接升级 3070 就能获得4k dlss 光追，而且性能不俗。

但是，从上面的分析来说，你虽然省了40%的钱，你买的也是更低一档次的核心，所以任何额外增加价格的添头，都不如直接多花些钱买 RTX 3080 一步到位划算。

最后关于性能提升，很多人都会祭出这张图：

与以往胡搞 Y 轴官图不同的是，这次的数据其实挺靠谱的，Y 轴是恒定比例的性能，而图中 2080 super 和 2070 super 相对 1080Ti 和 1080 提升是有无数测试作根据的，差不多就是20-30%的幅度，这在表上被如实反映了。所以如果按照表格数据推算，3080 直接比 1080Ti 强了1倍，比2080 Super 强了大约70%，3070 确实可以战平 2080Ti，但是我要多说一句的是：

并不完全是Ampere 太强，而是因为Turing 这代太弱。

历史上，每当显卡推出革命性新功能的那一代，绝对的性能提升往往很小，甚至不如上一代，因为你要消耗更多的芯片面积和晶体管去满足新功能的实现，但是下一代往往就是无脑堆性能了，因为有了前代的经验，这代卡就能取长补短，而且不用考虑支持新特性：

GeForce 8600 GT 这代显卡升级了对 DX10的支持，性能相对 7900 提升非常小，DX9中甚至不及，但是继任者 8800 GT 又刷新了记录，达到两倍的性能提升。

RTX 2080 相对 GTX 1080 提升幅度也有限，也是被光追这个大头功能拖累。

所以等到第二代改版核心 RTX 3080 一举超过孱弱的第一代光追卡，并不稀罕。而且这还有DLSS 2.0 的神助。从目前已有的 DLSS 2.0 游戏来说，这个功能能显著增加 1080p 以上画面的渲染性能，用极小的画质差异，换取几乎高一级的性能提升。再辅以光追，3080 这代卡真的可以说在 DLSS 4k + 光追下畅玩60 fps 游戏，这足以跟新一代主机和上上一代显卡拉开差距。所以显卡来说，隔代升级往往是非常不错的方式，性能和画质提升能察觉到质变。

最后回应回答最初的那个结论，为什么 Ampere 会成为 Pascal 那样的经典：

其实是因为造芯片便宜啊！留给NVIDIA 巨大的降价空间

980 Ti 贵就贵在使用 TSMC 28nm 制程，强堆了600mm2 的芯片面积来对抗 AMD R9 Fury X。

而使用了 TSMC 16nm制程的 1080 Ti，轻松通过通过471mm2 的芯片面积就干掉使用成本巨高 HMB 显存的 Radeon VII。而 1080 更是通过 314mm2 甜品芯片面积跨级做掉 Vega 64 大杀四方，刚好又赶上 Navi 难产的青黄不接，成为一代经典。

而到了 RTX 2080 Ti，无奈继续使用半代工艺的 TSMC 12 nm，把芯片搞到了史无前例的754mm2！这就算是卖 $1200 成本也是当年 1080 Ti 的两倍以上。幸好对手 AMD 放慢了显卡研发的脚步，导致即便如此终其一生也没有竞争对手。

现在终于迎来了使用三星 8nm 制程的 RTX 3090，虽然芯片面积没有透露，但是肯定远小于前一代的 754mm2，估计在550mm2左右，用这样的甜点芯片面积就能造出卖$1500的显卡，这不是赚翻是什么？所以即便如此，RTX 30系列也留下了充足的空间进行价格战。而当价格下降后，消费者空前的热情是挡不住的。

最后再提个小插曲，RTX 3080可以说极大借鉴了 Nvidia在数据中心服务器设计的经验，例如之所以用到那么创新的双风扇正反设计，一部分也得益于主板的设计精简：

而这种极其精简的设计又传承自之前的 Volta V100：

所以这不仅意味着我们会看到很多AIO厂商在散热器上继续玩出花，也意味这这代GPU能快速进入ITX机箱，移动平台。

所以如果还有什么忠告的话，千万不要买目前的游戏笔记本！

如果你能等上3个月，不出意外1月就能看到官宣的 30系笔记本GPU，而性能相对于20系也是大大的提升。

来源：

https://www.zhihu.com/question/418916610/answer/1448428805

评价四

作者丨ssertp

其实你们太小看8nm了。

很多人都不知道，三星在10nm节点吊锤台积电，10nmLPE能比第一代14nm提升27%的性能或者降低40%的功耗，10nmLPP在此基础上把性能再次提升10%，功耗降低15%。8nm在此基础上又降低了10%的功耗。

粗略计算一下，在同架构下，相较于GTX1050采用的14nm，8nm制程可以提升超过40%的性能提升或者降低至少54%的功耗，晶体管密度也实现了翻倍。

只要老黄愿意，同样的面积，三星8nm能轻松做到性能翻倍，毕竟比之前的工艺省电一半啊！所以才有了499刀的3070打2080Ti，699刀的3080一个顶俩。

另外，三星的8nm比台积电的10nm还便宜，而且是便宜得多。这个制程更适合高性能领域，之前嘲讽老黄贪婪的，现在岂不大呼真香？

来源：

https://www.zhihu.com/question/418916610/answer/1448373748

推荐阅读

如何配置一台深度学习工作站?
模型训练太慢？显存不够用？这个算法让你的GPU老树开新花
2020年深度学习如何挑选GPU？这篇 GPU 最全攻略请查收

添加极市小助手微信（ID : cvmart2），备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳），即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群：每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

△长按添加极市小助手

△长按关注极市平台，获取最新CV干货

觉得有用麻烦给个在看啦~

如何评价英伟达9月2日凌晨发布的30系列新显卡？

如何配置一台深度学习工作站?

模型训练太慢？显存不够用？这个算法让你的GPU老树开新花

2020年深度学习如何挑选GPU？这篇 GPU 最全攻略请查收