下一代手机CPU架构已至 除了A78还有新的惊喜

随着 5nm 制程已经实现了量产,且在今年下半年,苹果、华为旗下采用 5nm 制程的芯片也都将出货,对于手机行业来说,这是一波给手机芯片做性能提升的好机会,对于厂商来说,新制程、新芯片也毫无疑问是一波非常好的红利。
不过,新制程虽能让厂商在一时间把产品的性能带到一个此前难以达到的程度,但它带来的提升也是一次性的,最多后续像台积电之类的制造商对产线进行优化,研发出更加优化的工艺,"制程"这个点才有希望给芯片带来更进一步的性能提升。

否则制程升级带来的这一波红利,其实是转瞬即逝的,它会在很短的时间内被消耗掉,就像旗舰级芯片刚刚进入 7nm 时代那样。就目前来说,对于手机用的 SoC 而言,7nm 带来的红利已经基本上是被消耗一空了,新的芯片只能通过提升频率和改良 / 更换架构来获得更大的提升。
就像高通骁龙 865 那样,它和高通骁龙 855 同样采用 7nm 制程,为了进一步提升它的性能,高通更多是靠新架构来带动芯片整体的性能提升。出于生产方面的考虑,他们甚至没有选用台积电改良过的 7nm EUV 制程,而是选择了第一代 7nm 制程,这使得高通基本上没什么机会再堆叠芯片的晶体管。

所以 5nm 制程从长远来看,对于手机的 SoC 来说,它带来的提升更多是一次性的,想要让芯片能够在制程提升后的第二年还能在性能上得到稳定的增长,更新的架构仍然是必需要素。

这也是为什么笔者在之前的文章中会比较担心制程提升之后,假如 Cortex-A77 的后继者一直不来,芯片后续的性能提升可能会陷入一个瓶颈。好在,现在 5nm 制程芯片还没来,ARM 已经是把新一代的 CPU 核心架构给拿出来了。
有这个新架构为基础,在今后一两年的时间里,手机芯片厂商把现有的芯片性能稳步往上推进已经不是什么大问题,而在更后的时间里,很可能 3nm 制程又要来了。至少在这段时间里,芯片的性能提升基本上是不会再有什么瓶颈,而且可以预期的是,在 5nm 和新架构的双重提升下,芯片的性能可能会有一个突飞猛进式的增长。
这一次 ARM 拿出来的新架构有两个,一个是 Cortex-A78,另一个是此前没有过的全新系列 —— Cortex-X1。

现在芯片厂商不论是中端芯片还是旗舰级芯片,为了平衡性能和功耗,很多厂商都采用了"1+3+4"的架构,即把原先的 4 个大核分割分成两批,其中一个核心作为一个性能更高的"超大核"(或者相对于其他"中核"来说的大核),这个核心主要用来拉升芯片的单核性能。剩下的三个核心则运行在一个更低的频率上,防止芯片在长时间高负载运行下功耗和发热量太大。
由于超大核本身其实只是在普通大核做了频率拉升的一个特别核心,所以它的性能优势一般也只在频率上,和普通大核拉不开很多在性能上的区别,这也使得它能够承担的一个任务量也是有限的。

可能是出于在这种情况下,"1+3+4"的架构并不够优化,以及高端设备(特别是手机之外那些对功耗、续航没那么讲究的设备)对芯片的总体性能也会有更高的要求,在常规对 A 系列架构进行迭代外,ARM 特别推出了一个更优化、更迅猛的 Cortex-X1。

在今后的芯片中,A78 必然会作为芯片最主要的大核使用。从目前 ARM 给出的内容来看,Cortex-A78 的提升其实也是有一些依赖于接下来的 5nm 制程,就架构本身的提升和改良来说,它的提升是比较有限的。

这个架构并没有做非常大的改动,毕竟和 A77 的发布时间比,二者时间的间隔也仅仅只有一年,所以它本质上就如 ARM 所述的内容一样,它仍然是在 A76、A77 的基础上做出来的一个改良款。

对于这一代架构,ARM 虽然指出其性能提升还是达到了 20%,但是这个性能并非是峰值性能,而是一个很微妙的"持续输出性能"。换言之,这个提升只是建立在一个前后两代架构发热、散热情况类似的前提下,通过对比得到的一个"持续的"性能提升。

考虑到这其中存在 5nm 制程的加成和新架构在能效、发热上的优化,实际上纯粹的性能提升是完全达不到 20% 的。对于这个提升,ARM 给出了一个更详细的对比,在同样 1W/Core 的情况下,Cortex-A78 的频率是 3.0GHz,而作为对比 7nm 制程下的 A77 频率在 2.6GHz。

这 20% 的提升水分还是比较大的,同样,ARM 提到的一个能耗的对比也是建立在 A78 使用了 5nm 制程,同时频率要比 A77 更低的情况下。本质来说,如果不对 A78 做什么暴力魔改,它本质上并没有在性能方面做特别多的改进。

只有在同时结合了 5nm、高主频的情况下,其性能提升才能够逼近 20% 的水平。考虑到最终出来的核心并不可能全部都运行在 3GHz 这样的高频率上,最终我们能够看到的一个明年旗舰机的性能提升大概会在 10% - 15% 这个区间内(前提是芯片本身都采用 A78 作为大核)。

至于能耗,虽然有 5nm 的加持,但是考虑到在高负载下核心本身的频率也上去了,所以综合来说 Cortex-A78 在高负载下是可能不会有何明显的能耗优化,打起游戏来耗电速度还是会很快。不过对于日常使用来说,出于 5nm 的优势,手机的续航时间还是会有一定的延长。

如果我们想要在手机上看到更加迅猛的手机提升,或者在 iPad 之类的、基于 ARM 的计算设备上看到很强劲的提升,那么我们只能寄希望于 Cortex-X1,它是提升整个芯片巅峰性能的关键。

虽然 Cortex-X1 会占用更多的面积,但是它带来的性能提升是异常显著的,这一个核心能把整个大核集群的巅峰性能拉升 30%,如果这个提升出现在 PC 上,它足以让众多玩家、发烧友发出尖叫。
而且很有意思的是,Cortex-X1 并不是作为一个标准化的核心架构面向整个行业推出,ARM 给它的定位是"旗舰级的定制核心"。"定制核心"意味着像三星、高通这样的芯片厂商可以和 ARM 就 Cortex-X1 提出定制要求,ARM 可以调整这个核心的一些规格使其和整个 SoC 更加契合,是芯片最终呈现出来的性能、能效等更符合芯片厂商对其的预期。
对于不同设备、不同种类的芯片,Cortex-X1 的"可定制"会带来更多的差异,会使芯片这一块的市场更进一步的细分。实际上 Cortex-X1 就算是一个不支持定制的、标准化的架构,它也在某种意义上促进了芯片的细分,毕竟芯片厂商终于找到了一个在旗舰级 SoC 上做细分的机会,他们可以打造出一个性能更高但是更贵、包含 Cortex-X1 的 SoC,然后再造一个没有 Cortex-X1 的普通 SoC。

不知道在这样的细分下,未来旗舰机会不会在目前"三种杯型"的基础上进一步扩展机型的变种,或者高端的机器会走向更高端,形成一个新的细分价位、细分市场。

Cortex-X1 是一个完全为性能而生的核心,它完全不考虑功耗等方面的因素,所有的改动都是为了性能的提升。这也使得它得到了一个非常暴力的性能提升数值,但同样,作为代价,这一个核心的功耗要远高于普通的 A77、A78 核心。
这个核心不论是在 L1/L2/L3 缓存上,还是在计算架构上,这个核心带来的提升对比 Cortex-A78 是非常诱人的,然而即使是在 5nm 的架构下,其功耗还是要比一个 A78 还要高出一大截。
从这颗核心的本质上来说,除非一个大核集群全部用它,否则它还是比较难和大量 x86 平台的设备比性能,而如果全部用它,对于一个移动设备来说,它的功耗和发热就会相当吓人了。
而对于手机来说,哪怕是只用一个核心,它带来的额外功耗和额外发热也是比较棘手的事情,如果后续芯片厂商会在"1+3+4"这个架构中把其中的这个"1"换成 Cortex-X1,那么我们最终看到的手机不但可能不会再回到之前的轻薄 + 小电池的形态,因为这个核心的存在会进一步加重手机对大电池的依赖。

而发热量的增大也基本上意味着,目前的 Android 手机必然要保持当下这种比较复杂的、多层且含有热管的散热系统,甚至可能会因为芯片总体发热比较难控制而需要加强(不过这个可能性不是很大,很多 Android 旗舰的散热都做得很到位了)。
目前来看,厂商应该不会有想法使用多个 Cortex-X1,如果是这样的话,手机厂商的压力就非常大了。
Cortex-X1 带来的直接优势是,在性能上 Android SoC 会和苹果更加接近,二者的差距会进一步缩窄,高端的 Android 手机(售价普遍超过 5000 元)将更能满足用户对性能的追求。

目前来说,Cortex-A78 和 X1 公开之后,最惨的可能是海思麒麟在今年下半年要发布的首款 5nm 制程的芯片,这款芯片本身坐上了 5nm 的首发车,这是好事,但是没想到的是,这班车同样也是 A77 的末班车。
假如高通、三星之后的旗舰级 SoC 都会直接上 A78,甚至是 X1,那么即使华为在下一款麒麟 SoC 上下了很大的功夫去优化性能,因为这一个架构上的差距它很可能还会落后差不多一代的水平,而且这还是相较于 A78 而言的。

这将直接影响到后续华为旗舰在全球市场的竞争力,可能会迫使华为在短时间内加快他们旗舰级 SoC 的迭代,或者是推出一些经过了进一步超频的、优化了性能的版本来缩小差距。