外设堂

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
外设堂 首页 业界动态 图形 查看内容

惊人的核心怎么来的?RTX3090架构魔术揭秘

2020-9-3 10:24| 发布者: 大胖鸟| 查看: 2121| 评论: 13|来自: 快科技

摘要: NVIDIA的RTX 30系列显卡今天凌晨发布了,旗舰RTX 3090显卡虽然价格涨到了1.2万元,但是性能比RTX 2080 Ti翻倍,简直是开挂一样。就跟2018年图灵GPU发布时一样,老黄这次在发布会上再次强调安培GPU是有史以来性能提升 ...

NVIDIA的RTX 30系列显卡今天凌晨发布了,旗舰RTX 3090显卡虽然价格涨到了1.2万元,但是性能比RTX 2080 Ti翻倍,简直是开挂一样。

就跟2018年图灵GPU发布时一样,老黄这次在发布会上再次强调安培GPU是有史以来性能提升最大的一次,这点上也没错,毕竟显卡性能翻倍是这10年来都少见的。

RTX 3090显卡是怎样做到性能翻倍的?除了第二代RT单元、第三代Tensor单元之外,CUDA核心数也猛增到了10496个,要知道RTX 2080 Ti也不过4352个。

CUDA核心数一下子从4000+翻倍到了10000+,这规模提升也太恐怖了,NVIDIA到底是怎么做到的?

特别是在发布之前,连AIC显卡厂商拿到的数据都显示RTX 3090是5248个CUDA核心而已,怎么就一下子翻倍了?

现在NVIDIA还没公布安培GPU的架构,具体如何还不好说,不过我们可以分析下几种可能。

上面是7nm安培GA100的架构图,每组SM单元中有64个INT32单元、64个FP32单元及32个FP64单元。

8nm安培游戏GPU跟A100主要架构应该差不多,但是不需要多少FP64单元,多了RT Core光追单元。

所以第一种FP32单元翻倍的可能就是——A100中的FP64单元被游戏GPU中的FP32取代了,这样带来额外一倍的FP32单元。

不过算起来简单,实际上就不好说了,因为A100是7nm工艺,核心面积依然有826mm,安培游戏GPU才8nm工艺,晶体管密度更低,280亿只有A100的540亿的一半,核心面积会小很多,还要加上RT Core单元,所以这种可能性非常小。

第二种可能在推上有人分析过,那就是游戏GPU不仅砍掉了FP64单元,同时还做到了INT32单元跟FP32一样的功能——可以同时计算整数或者浮点,这样一来64个INT32摇身一变也是FP32单元了,直接数量翻倍。

这个可能性比较大,也是NVIDIA之前称CUDA核心数是5248个,临到头改成10496个的合理解释了。

当然,最后一种可能就是阴谋论了,老黄并没有做到1万多个FP32,就是马甲忽悠——不过真要是这么做,以后会有法律麻烦,老黄不会这么轻易让人抓到把柄的。

总之,在没有官方公布的细节之前,1万多个CUDA核心的由来比较迷,但不论那种解释,NVIDIA肯定是技术上可以做到,否认也不会有如此大的性能提升了。

发表评论

最新评论

引用 半自働 2020-9-7 06:04
666
引用 sbiuggypm 2020-9-5 10:52
老黄这次的挤压力度没掌握好,
引用 zhqy 2020-9-5 00:39
高端~
引用 大树在生长 2020-9-4 09:16
围观
引用 只是试玩啊 2020-9-4 08:52
电费吃不消。。。
引用 月下思红颜 2020-9-4 08:49
买不起只能看看,哈哈
引用 Kuriboh 2020-9-4 08:43
看看
引用 PRjaCk 2020-9-4 08:43
犀利
引用 CraZy_ZyQ 2020-9-4 00:27
看看
引用 沙漠的fei鱼 2020-9-3 20:01
666
引用 灬Pei 2020-9-3 19:45
外观帅气,散热设计很新奇
引用 半自働 2020-9-3 14:43
666
引用 watercooled 2020-9-3 12:58
新的外观帅气

查看全部评论(13)

手机版|外设堂 ( 辽ICP备13014379号 )辽公网安备 21010202000549号

GMT+8, 2024-5-19 11:26 , Processed in 0.060489 second(s), 15 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

返回顶部