深度解析苹果a12处理器是什么(深度解析苹果A12处理器)

9月13日,苹果发布了三款新iPhone。与此同时,A12、苹果备受关注的s下一代处理器正式曝光。从苹果官方公布的信息来看,A12非常强大。那么他的表现如何呢?和华为刚刚发布的麒麟980以及安卓之前的旗舰处理器高通骁龙845相比如何?

昨天,外媒AnandTech发布了一篇关于苹果A12处理器的分析文章。AnandTech还引用了TechInsights的苹果A12的拆解图,分析了苹果A12的内部结构,也对A12进行了性能测试。他们认为苹果公司的业绩改善数据美国官方A12保守,这个芯片的实力其实更强。让让我们一起来看看:

苹果A12的内部结构更复杂。

除了性能测试,AnandTech还引用了TechInsights的苹果A12的拆解图,分析了苹果A12的内部结构:

A12内部结构图

上面A12的内部结构图最左边是NPU核心,最右边我们可以看到A12的四个GPU核心,中间是分成四块的系统缓存。A12的六个CPU核心位于上图的中下方,左边是两个Vortex CPU核心,中间是四个大型L2缓存,右下方是四个Tempest CPU核心和它们自己的L2缓存。

A11内部结构图

相比苹果A11芯片的内部结构,A12的内部设计变化很大。NPU核放在最左侧,在SoC中的面积也大增。苹果声称其NPU已经从A11中的双核设计变成了新的8核设计。增加了一个GPU核,A12的GPU占用的面积进一步增加。另外,可以看出A11中的SRAM系统缓存分为两个块,而A12分为四个块,说明这个块的系统缓存性能发生了很大的变化。

总的来说,苹果A12的内部结构相比过去有了很大的变化。AnandTech表示,A12的系统缓存变化是A7推出以来最大的变化。

另外需要补充的是,A12的单个GPU核面积比A11减少了37%。显然,在7nm新制程的加持下,A12可以进一步缩小面积,增加一个额外的GPU核心。

NPU面积增长3.16倍,业绩暴涨。

A12采用了新的TSMC 7nm工艺,A12的晶体管密度有了很大的提高。所以从A12和A11内部各功能模块的面积数据对比来看,A12虽然性能更强,但整体管芯尺寸比10nm的A11小。

2 A11和A11中功能模块面积数据对比

另外可以看到,在7nm工艺下,A12的CPU核和GPU核的面积比10nm的A11要小,但是A12的NPU核的面积是5.79mm,是A11的NPU(1.83mm)的3.16倍。NPU核心面积的激增,加上先进工艺的加持,单位面积的晶体管密度增加,直接导致了NPU性能的激增。

据苹果公司称,A12 s NPU内核8核,具有机器学习、多精度支持和智能计算系统。具体性能方面,相比上一代苹果A11每秒6000亿次运算的计算能力双核NPU,苹果A12 s NPU每秒可执行5万亿次运算(5TFLOPS),配合ISP、深度引擎、安全舱、文章处理器、文章编码器、内存控制器等重要部件,更加智能化。

此外,机器学习(ML)是神经引擎最重要的功能之一。苹果A12 s CoreML开发库的学习能力是上一代的9倍,但功耗只有上一代的1/10。它的智能不仅体现在Siri功能的灵活性和多样性,还体现在拍摄、AR、游戏(运动跟踪和图形渲染等方面。)和Face ID。

有传言称苹果A11 的NPU内核是基于CEVA IP,但这一传闻并未得到证实,因为苹果不想让外界知道。

新的高速缓存设计

如前所述,A12在系统缓存方面做了很大的改动,A12的一级/二级缓存的大小核CPU也变了。

图片来源:TechInsights苹果A12Die Shot,ChipRebel苹果A11Die Shot

从上图可以看出,A12涡旋CPU核的L1缓存比例是A11的两倍。根据AnandTech s推测,A12的Vortex大核CPU中的L1缓存比A11翻了一倍,从64KB提升到128KB。而Vortex CPU的L2缓存与A11一致。

那么苹果到底是什么的缓存层次结构是什么样的?通过查看不同测试深度下的内存延迟行为,可以清楚地看到L1缓存从64KB增加到了128KB(是一条没有延迟的直线)。然而,AnandTech发现了一个奇怪的现象。在3MB范围内,延迟缓慢增加,直到大约6MB。应该注意,只有在完全随机模式下访问时,才会出现这种行为。在一个小的访问窗口内,延迟曲线在6MB之前是平坦的,当超过6MB时,延迟曲线几乎呈直线上升趋势。此外,AnandTech认为整体系统缓存不仅芯片数量翻倍,容量也从4MB增加到8MB。

在CPU核心方面,从测试来看,似乎A11 的可调用L2缓存的单个CPU内核被限制在512KB,而A12 s增加到1.5MB然而,AnandTech被缓存的电源管理策略欺骗了。可以看到A11 Mistral核延迟,从768KB到1MB有明显的跳跃,而A12核在2MB也可以看到类似的跳跃。实际上,A11 的整个L2缓存s的CPU核心是1MB,而A12 s是2MB。

需要指出的是,缓存的工作原理是,当CPU要读取一个数据时,先从缓存中查找,如果找到,就立即读取并发送给CPU处理;如果没有找到,会以相对较慢的速度从内存中读取,并发送给CPU进行处理。同时将这个数据所在的数据块转移到缓存中,这样以后就可以从缓存中读取整个数据块,不需要再调用内存。

从上面的分析我们可以看出,苹果的缓存系统非常强大。与A11相比,A12系统的缓存大小增加了一倍。实际运行中,CPU核上约有16MB可用缓存层次,远超其他竞争对手。缓存的增加会大大节省CPU直接读取内存的时间,让CPU的处理速度更快,也在一定程度上降低了能耗。

CPU比得上6代酷睿吗?

根据苹果官方公布的信息,A12基于TSMC 7nm工艺,内置六核CPU,包括两个性能核心和四个效率核心。其中,性能核心性能比上一代提升15%,功耗降低40%;而效率内核将功耗降低了50%。

根据AnandTech的测试数据,A12的CPU由两个Vortex 2.5GHz大核和四个1.59GHz Tempest小核组成。

目前主流芯片的能耗比例如下:深灰色为A12,浅灰色为A11,其他为三星9810,骁龙845等。

根据SPECint2006的基准测试数据,A12在上一代设备上的性能比A11高24%。单位能效比(即运行与功耗的对比)提高了12%,但随着内部缓存的增加,功耗也增加了。A11的平均功耗约为3.36W,A12的平均功耗为3.64W

AnandTech s基准测试表明,A12 的内核和架构改进其实比苹果官方公布的更深入。其性能和功耗超过了Exynos9810、骁龙845等安卓阵营常用的芯片。

AnandTech表示,A12与上一代A11和台式机CPU的差距是相当惊人。他们还介绍了苹果如何通过软件调整来提高旧设备的性能。以iPhone 6s的A9为例,CPU最高频率435ms,但iOS 12的时间缩短到80ms,极大地提高了交互式工作负载的性能。A10也做了类似的改进(从400毫秒到210毫秒),但A11没有变化。

总而言之,AnandTech说A12是一个大变化苹果的处理器,其CPU性能最多可以提升40%。在SPEC2006int测试中,A12的单线程性能甚至优于下变频的Intel Skylake处理器。

GPU性能是骁龙845的两倍。

去年年初,Imagination公开表示,苹果计划在15至24个月内停止在新产品中使用其知识产权。于是,去年苹果A11推出的时候,就有消息称A11的GPU是苹果自己研发的。但实际上,它似乎仍然是基于想象由IP定制的。因为它的内核设计和之前的Imagination Rogue很像。此外,A12的GPU仍然支持PVRTC(PowerVR纹理压缩),一种专有格式,这意味着GPU可能仍然与想象力的IP相关联。

如今,15个多月过去了,想象力被中国资本收购。所以A12有望采用苹果自主研发的GPU。

图片来源:TechInsights苹果A12Die Shot,ChipRebel苹果A11Die Shot

但G11P(主频1.1GHz以上)的A12 GPU还是和去年的A11 GPU有一些明显的相似之处,其内部的功能块似乎在很大程度上位于相同的位置,构造方式也很相似。

AnandTech表示,苹果在A12 GPU上最大的进步是它现在支持内存压缩,这本身就可以显著提高性能。在桌面领域,像Nvidia和AMD这样的GPU已经支持这项技术很多年了,它甚至可以在不增加内存带宽的情况下提升GPU的性能。同样,智能手机的GPU也需要内存压缩,这不仅是因为移动SoC上的带宽有限,更重要的是因为高带宽要求带来的功耗降低。

比如Arm的AFBC(Frame Cache Compression Technology)技术,一直是业界经常提到的技术。同样,其他制造商如高通甚至Imagination也有自己的相关技术。

所以得益于内存压缩的支持,7nm工艺的加持,以及一个GPU核心的加入,A12的GPU性能确实有了很大的提升。

从苹果公布的数据来看,苹果A12内置4核GPU,性能较上一代大幅提升50%(A11为3核GPU)。

在GPU性能测试方面,AnandTech采用GFXBench阿兹特克废墟场景作为测试基准(2K分辨率)。在高特效下,可以看到A12 GPU的峰值性能比上一代A11提升了61%,是高通骁龙845 GPU的两倍,甚至秒杀了基于麒麟970的华为P20系列。

总结:

从介绍上不难发现,相比之前的A11,A12确实做了很多改进:不仅重新设计了系统缓存(名为A7上市以来最大的变化by AnandTech),而且CPU内核也有了明显的提升。GPU开始支持内存压缩,NPU大幅升级,都带来了令人印象深刻的性能提升。