为什么电脑CPU不做超级大核?

论坛 期权论坛 股票     
期权匿名问答   2023-2-5 03:28   7517   5
为什么不弄一两个超大核去解决那些多核围观的应用场景?打游戏的能吃完这么多核,还是买来数框框的?
分享到 :
0 人收藏

5 个回复

倒序浏览
2#
期权匿名回答  16级独孤 | 2023-2-5 03:29:16 发帖IP地址来自 中国
造CPU又不是儿戏,你想造多大规模就造多大规模啊,哪有这么简单
首先最基本的一个问题,你有合适的制程吗?这是非常重要的
因为所谓的超级大核,无非就是超宽架构、超多发热与执行单元以及超大缓存,那么带来的直接问题就是面积过大,除了这些之外还有很多不被观察到的努力,比如说为某些方面做的优化,这些也会体现到具体面积表现上去,但是不一定体现到CPU架构图里
你如果没有合适的制程,那么就没有对比现在主流CPU的所谓“超级大核”出现
intel/AMD都是商业公司,都是要赚钱的,造这些CPU是要看良率的,面积大了,成本就高,能卖出去多少是个问题,这些信息都会有专门的人去设计专门的计算模型
而对于自研芯片的公司来说也要考虑对应的效益,也不是无脑堆巨核,苹果的大核已经几代没有大改了,其中还经历过制程换代
顺带一提,这都还是建立在“巨核研发出来了、巨核效率高”的基础上的
因为你不是光靠堆规模就一定可以获得可观的收益的,CPU架构是一整个体系,看起来像是暴力堆规模、执行单元数量、缓存大小上去了,最终IPC提升小这种现象也是存在的,甚至还有过 多了60%晶体管结果IPC提升6-8%的现象
甚至是还要考虑软件层面的收益,对于有些屎山你再怎么使劲它完全可以油盐不进,花80%的代价提升20%甚至更低的性能这种情况是存在的
对于一些老指令集就更难提升了,远的不说像MMX之类的,现在X86的主流架构对这个的提升都小了,现在更多的是放在SSE、AVX的提升上,更老的甚至是移除掉了专用电路(给新电路腾出空间),靠模拟来实现兼容了,这性能怎么大提升

当然从发展的角度来看,未来一定会有比现在大得多的超级巨核
只要制程还在继续发展,这些公司都没倒闭还在提高产品性能,未来就一定会有规模远胜于现在主流架构的巨核,诸如几十解码、几千ROB、几十个后端执行单元的架构未来一定会有,有异议可以过5-10年再来看这段话,我并不想改变这个结论。
顺带一提,把时间往回拨,10年前是Haswell的时代,在那个时代来看今天的Golden Cove、Zen4以及Cortex X3、Avalanche架构,可能都会感到这都是不可思议的超级大核。
3#
期权匿名回答  16级独孤 | 2023-2-5 03:29:57 发帖IP地址来自 北京
因为事实上「既需要性能, 又只能吃单核心」的应用已经不多了.
哪怕是十几年前 DX9/10 的老游戏, 放到如今 4-5 Ghz, IPC 还更高的 CPU 去跑, 短板很多时候是在缓存上.
就像当初 12900K 刚发布那会, 有些 i 粉声称全小核跑也有很高的性能输出, 这种测试结果跟「我和科比合砍84分」没啥本质区别.
况且单核心性能提升不是那么容易, 频率提升的空间并不大, 高度依赖架构、工艺甚至是体质差异; 纯架构层面的 IPC 提升往往和提升频率互斥.
还不如多做几个核心, 把总缓存容量拉上去, 或者像 3D V-Cache 那样暴力加缓存, 这样单核/多核场景多少都有提升.


而且现在 bf2042/warzone 这种多人在线游戏吃满 CPU 也不稀奇了:


至于 ARM 这边所谓的超大核, 只能用着少的可怜的 L3, 除了刷单核分的时候效果很明显, 实际打游戏的时候相当一部分性能输出还得看中核.


而 ARM 的超大核面积不小, 性能不强; 中核面积控制的不错, 但是能效垃, 峰值性能也非常凑合, 所以 1+3 或者 1+4 的架构常常表现出高分低能的情况.
4#
期权匿名回答  16级独孤 | 2023-2-5 03:30:20 发帖IP地址来自 北京理工大学
电脑本来就是超大核+大核。所谓的小核,性能跟以前的14++++++是一样的,这哪是小核啊。。。就连高通给电脑平台做的骁龙8cx gen3,都是4核x1,4核A78,也是超大核+大核。。。
5#
期权匿名回答  16级独孤 | 2023-2-5 03:31:19 发帖IP地址来自 北京朝阳
有一个非常经典,非常古老的测试程序,至今你还能在不少评测测试中看到这个测试,Fritz Chess Benchmarks,俗称国际象棋测试。它利用计算国际象棋盘面的算法来评估cpu性能。
这个测试这么古老还依然会被拿出来用的原因是它代表了一类典型负载,古老,几乎没有任何指令集优化,workset也很小,对缓存,内存都几乎没压力,纯粹拼cpu的速度。明明是在测试性能,但是对cpu的负载压力非常轻——cpu满载时的功耗很低,比打游戏时都低。因为这个测试,根本吃不到cpu核心‘大’的红利。
这个测试的分数,是一一颗20多年前的cpu,奔腾3 1Ghz的成绩为480千步,以此基准为100%,来衡量的,计算结果是参考值的多少倍就乘以多少倍。而用一颗默频关闭pbo的5950x在4.6Ghz下16线程运行这个测试,得到的成绩是大约8400%,4万千步。
计算下4.6*16,得73.6,而5950x的成绩比奔腾3来说是84倍,可得,20多年过去,zen3架构比起远古级别的奔腾3,在这个测试中,同频性能仅仅提高了不到15%。

说这个故事是想告诉题主,认为无限加‘大’核心,可以提高‘单核性能’的观点,是有严重边际效应的,尤其是考虑到大多数游戏的负载富含非常难优化的线性逻辑程序。直接怼频率才是真正绝对有效的手段,可惜这个手段越来越难以使用,而做巨大的核心对于提高频率来说反而是有不利影响的
6#
期权匿名回答  16级独孤 | 2023-2-5 03:32:09 发帖IP地址来自 北京
Golden Cove和Firestorm已经够大了,再大点研发起来太麻烦
而且如果游戏有多核优化,你把大核性能做强了,再增加核心数还是能用得上并提升性能啊……
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:400157
帖子:80032
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP