Board logo

标题: [硬件] iPhone 6 A8处理器完全解密!完美苹果风 [打印本页]

作者: bobwu    时间: 2014-10-7 14:52     标题: iPhone 6 A8处理器完全解密!完美苹果风

苹果表面上是一家手机厂商,但这几年已经悄然在移动处理器行业占据了一定的地位,尤其是CPU:A6首次使用自主设计架构Swift,A7首次使用64位ARMv8架构Cyclone。A8又能带来什么惊喜呢?

很可惜,如果你期待又一次革命,那恐怕要失望了。无论CPU还是GPU,A8都只是一次稳健的进步,并不算很激进。


A8


A8内核照片与基本布局

【新工艺、内存】

A8最大的亮点其实是制造工艺,并且创造了多个第一:

它是第一批采用20nm工艺制造的移动处理器之一,也是最重要的一个。

这是苹果第一次使用最先进的半导体工艺(28nm诞生了一年多采用上)。

这是苹果第一次使用非三星工厂代工,当然也是第一次使用台积电代工,而且一下子就抢走了绝大部分产能。

台积电宣称,20nm工艺相比于28nm可使芯片速度提升30%,或者集成度提高90%,或者功耗降低25%,具体如何权衡就看芯片设计了。A8晶体管数量翻了一番,核心面积小了13%,性能……稍后再说。

A8的内存子系统基本没变,只有一些细微的调整。SRAM缓存依然存在,继续同时为CPU、GPU服务(可视为三级缓存),容量还是4MB,而内存控制器还是支持LPDDR3-1600。

经过测试发现,A8的内存带宽比A7略有增加,2-9%的样子,很小,说明来自进一步优化。

更有趣的是内存延迟,1-4MB SRAM缓存区域、6+MB内存区域都降低了大约20ns,但具体如何实现的仍有待考察。

除了CPU、GPU、缓存、内存,A8里还有其他大量的固顶功能模块(或者最多时弹性很有限的DSP),包括音频控制器、USB控制器、视频编解码器、闪存控制器、摄像头ISP等等。具体在芯片的哪个位置、特性如何还不清楚,但至少知道,A8支持H.265格式视频编码,不过目前只会用于FaceTime视频通话。


A8、A7对比


苹果自主处理器历史


作者: bobwu    时间: 2014-10-7 14:53

【CPU架构:没有革命 仍然惊喜】

两年多过去了,我们对A6、A7 CPU架构仍然知之甚少,苹果始终不肯公布任何技术细节。A8仍是如此,这一次甚至连架构代号都还不知道(以前两代分别是Swift、Cyclone)。

就目前所知,A8 CPU架构设计并没有像A6、A7上那样有着革命性的地方,也就是个增强版的Cyclone,但也并不算是坏事。A7架构已经十分优秀:较宽、较高的IPC设计,延迟很低,可以在很低的频率下取得很高的性能。(Intel酷睿的理念也与此类似)

A7的频率只有1.3GHz,A8也不过区区1.4GHz,但正因为如此,苹果无需在频率上投入太多,就能获得理想的性能,同时保证功耗足够低,这对移动设备来说显然是再理想不过的。

换句话说,苹果在去年就完成了其他芯片厂商明年才有可能做到的。

尽管不用再费力挖掘架构细节,但我们仍然想知道,A8究竟改变了什么。

根据估量,A8 CPU部分面积约12.2平方毫米,相比于A7 17.1平方毫米缩小了29%,也就是说在塞入了更多晶体管后,苹果凭借更新的工艺,反而减小了CPU所占面积。

从测试数据看,A8、A7 CPU的确是如出一辙,很多底层测试中都表现得就像同一颗芯片,只是浮点加法和整数乘法延迟更短了一些,缓冲和分支预测也可能略有不同。

A7只有1个整数乘法单元,需要4个周期执行,A8则只需3个周期,更神奇的是整数乘法性能翻了一番还多,这意味着现在有2个整数乘法单元了。

浮点加法也有很大提升,不过幅度没这么高,执行周期从5个缩短到4个,貌似仍是3个浮点ALU单元。

总体而言,A8、A7的变化有点像是Intel Tick-Tock的后一步,即升级工艺,架构上只是微调增强。

接下来看一些更接近表层的测试。这里使用多年前用于PC系统的SPEC CPU2000,如今移动处理器的档次拿来跑它正合适。

A8的频率高了100MHz,也就是大约7.7%,排除这一因素后,A8的性能仍然明显高于A7,12个子项全部有提升,尤其是MCF、GCC、PerlMmk、GAP的幅度都很高,最高达55%。

再来看Geekbench 3,包括整数、浮点两部分。

仍然普遍有提升,幅度也不错,最高达到了37%,但是加解密差点,排除频率因素后偶尔甚至还有所倒退。

浮点部分更好些,各项提升相对比较均匀。

总体而言,A8 CPU没有再次革命,但凭借架构优化、内存延迟改进、频率提升,仍然有了不小的进步,完成了“A7升级版”的基本任务。

明年,大批的64位ARM处理器将陆续登场,既有公版的A57,也会有非公版的自主设计,苹果将面临严峻的挑战,但相信A8仍然能有自己的立足之地。

虽然四核、六核、八核将大行其道,苹果依然只是个双核,但是已经可以看出,苹果的单线程IPC一直十分优秀,而现在很多工作任务仍然无法很好地支持多核,A8根本不用怕。

当然了,下一代A9能再次带来什么惊喜更值得期待。


作者: bobwu    时间: 2014-10-7 14:53

【GPU架构:六核?没必要】

库克宣称A8 GPU性能提升最多50%,这很自然让我们以为是从四核变成了六核,会用上Imagination最顶级的PowerVR GX6650

但是经过对芯片的观察,却只发现了四个GPU核心,排除了六核的可能性。

再结合其他信息,尤其是苹果的Metal编程指导,最终确认A8采用的是四核PowerVR GX6450,也就是A7 G6430的升级版,基于最新的PowerVR Series6XT架构,年初的CES大会上才宣布。

Series6XT是此前2012年诞生的Series6架构的增强版(G6430就属于后者),重点是通过架构上的各种调整和优化,提升性能、增加功能,比如支持下一代纹理压缩技术ASTC(自适应可扩展纹理压缩)。

该技术来自出品了OpenGL、OpenGL ES等标准规范的行业组织Khronos,可提供更好的纹理压缩性能、更精细的质量控制,同时也是所有GPU都可以支持的通用格式。

苹果一直都在用PowerVR GPU,一直支持PVRTC、PVRTC2,ATSC则可以进一步提升游戏画质和性能。

Series6XT架构还有新的电源管理技术,能降低待机、轻负载时的功耗,比如说“PowerGearing G6XT”门控技术可以单独开关每个GPU核心(着色器簇/USC),自然能够延长手机的待机时间。

Series6XT通过一系列底层优化,提升了总体性能,官方宣称最多可达50%,正好也是苹果宣传的数据,但具体怎么做的,Imagination并未公开。

我们只知道,新架构对核心(着色器簇)本身做了改进,仍然是16宽度的SIMD结构,但每条流水线都增加了一组中等/半精度FP16 ALU,也就是从2×3变成了2×4,理论上性能可提升33%。

FP16操作比FP32节省带宽和功耗,但是需要精心编程才能高效利用,否则性能提升会很有限。

FP32部分仍然是每条流水线两个ALU,每时钟周期最多四个FP32浮点操作,或者说128个MAD(乘加运算)。

前端和后端的几何处理、纹理填充同样有所改进,但还是细节不详。

最后是GPU计算性能。iOS仍然没有提供这方面的良好支持,OpenCL也没有相应的版本。iOS 8增加了Metal API,可以同时用于图形、计算,但效果如何还有待观察。

GPU频率完全不知道,也不太容易测试。

总体而言,GX6450可以在部分优化、支持到位的项目中获得50%的性能提升,有的则可能只会看到15-20%,一般来说也就是30-35%的样子吧。

为什么还是四核?

其实,Imagination已经有了更强大的六核心型号G6630、GX6650,完全可以更好地满足更大屏幕的iPhone 6、iPhone 6 Plus,而且有了新工艺的支持,晶体管、核心面积都可以更好地控制,为什么还是坚持四核心呢?

这再次体现了苹果的设计原则:绝不盲目追新,够用就好。

A8 CPU上只是一次进化,GPU也不必急着革命,尤其是G6430本来就已经很强大了,iPad Air 2048×1536的屏幕都不在话下,iPhone 6 Plus 1080p又算什么,GX6450本身的改进加上频率提升(如果有的话)确实正好。

A7 GPU部分的面积是22.1平方毫米,A8缩小到了19.1平方毫米。看起来很理想,但别忘了20nm理论上可以让它缩小11.1平方毫米的。这说明A8 GPU还是增强了很多的,尤其是那两块清晰可见的共享纹理单元,将对纹理性能产生至关重要的影响。

说到最后,对明年的A9更期待了:16nm工艺、CPU新架构、六核心GPU……


作者: chengxyt    时间: 2014-10-7 19:47

SF




欢迎光临 NBCLUB笔记本电脑俱乐部 合肥THINKPAD APPLE LENOVO DELL专卖店 (http://nbclub.net/discuz/) Powered by Discuz! 7.2