“芯事重重”是腾讯科技半导体产业研究策划,本期聚焦苹果Vision Pro的芯片设计理念、功耗难题以及苹果对抗功耗的产品理念。
文 / 汪波 《芯片简史》作者,资深芯片研究专家
首款“混合现实(MR)头显”,可以“透”过它看世界,开启“空间计算”时代。
6月6日苹果公司CEO库克在全球开发者大会上发布了“Vision Pro”。库克以一句“one more thing”,再次吊起无数熬夜观看的粉丝的胃口。仿佛苹果公司展示的不是地球另一端的一台设备,而是来自未来的、只有在科幻片里才能呈现的某种幻想科技。
早在16年前,当乔布斯发布第一代iPhone时,当时主流手机上的固定键盘被替换为一整块任意触摸的屏幕,扩展了手机的“面子”。而这一次,库克则把这块“面子”扩大到了整个房间。从iPhone到Vision Pro的这一步,苹果把古希腊先贤的“人是万物的尺度”发挥得淋漓尽致,由此人类成为观察一切事物的中心。
透过这台Vision Pro,无论是3D电影、正在浏览的网页、还是周围活生生的人,都清晰地呈现在你面前。而你的眼神也能透过Vision Pro内置的摄像头和表面的屏幕显示给你的朋友。就这样,虚拟和现实在Vision Pro上实现了完美的结合。
而能够支持这种无缝结合和切换的,是Vision Pro的核心:一款计算芯片M2和一款传感器处理芯片R1,二者像两根大柱子共同支撑起苹果的“空间计算”的大厦。
01 疯狂“堆料”的R1和M2芯片与无法回避功耗难题
苹果这颗自研的M2芯片采用台积电5纳米工艺制造,包含了200多亿个晶体管。它不是传统意义上的CPU,而更像是三头六臂、拿着各种宝物的哪吒太子。在这颗M2芯片里,苹果集成了8个CPU内核、10个GPU(图形处理单元)内核和16个神经网络加速内核,这还不够,还有容量24GB的存储器、以及存储控制器、编解码模块等。
简单提一下5nm,目前市面上采用该工艺的产品不多,2020年10月份上市的苹果A14芯片和华为的麒麟9000以及高通的车芯8295,均采用该工艺,晶体管的数量分别为119亿和153亿(高通8295晶体管数量公开报道为百亿级)。
业界对5nm工艺最核心的关注即发热和功耗,尽管车芯不存在类似的担忧,但是在移动端却是大规模应用的障碍。
*Apple M2芯片 Die Shot
至于R1芯片,被称为协处理器或者传感器处理芯片,它是M2的左膀右臂,有效地分担了M2计算芯片的任务,尤其是来自摄像头以及各种传感器的数据。R1能在12毫秒内将摄像头的图像显示到头显内置的两块4K LED显示屏上,极大地消除了用户产生晕眩的可能。此外,R1芯片还接入了17个传感器,包括陀螺仪、加速度计、6个麦克风等,还能协助处理蓝牙、超宽带(UWB)以及惯性测量单元的数据。
在如此强大功能的加持之下,M2和R1芯片也成为Vision Pro中当之无愧的“电老虎”。这导致Vision Pro续航时间只有2小时,远小于苹果的Macbook Air等电脑,以至于这台固定在头部的设备不得不通过一根电缆连接到一块手机大小的锂电池,后者需要放在用户的口袋里。
这块沉甸甸的电池将我们的畅想打回现实,让我们意识到仍然生活在21世纪的20年代的地球,而不是未来的科幻片中。
花费长达7年的时间研发,苹果对这款明年才能上市、价格高达3499美元(约合人民币2.5万元)的Vision Pro下了血本,也下了很大的赌注。
然而,理想丰满,现实骨感。“耗电高”、“发热大”,发布会一结束,伴随着粉丝的欢呼声的,是这些听起来颇为刺耳的评论。为何会有如此大的反差?一方面是苹果公司展示给我们如此酷炫的科技,以及对未来极大期许;而另一方面则是用户能感受到的非常现实的问题:耗电高、发热大。
02 苹果与功耗的“战争”
其实,苹果公司跟耗电的战争由来已久。
早在乔布斯时代,苹果就对iPhone和iPad内的Flash动画应用“说不”,这可是冒着得罪有上亿用户的Adobe公司和全世界上百万Flash开发者的风险,更不用说Flash动画背后实力雄厚的广告商了。背后的原因就在于Flash应用极为耗电,极大缩短了移动设备的使用时间。
*乔布斯当年发布在苹果官网的公开信《Thoughts on Flash》,其中第四点强调(Flash)软件解码太耗电,移动设备必须硬件解码
此外,早期的苹果手机和平板上的Home键被赋予了一种功能,只有关闭一个应用并返回桌面,才能打开另外一个应用,这也是为了降低功耗。
苹果公司跟耗电的斗争已经如基因般刻在了骨子里,在Vision Pro上,苹果公司对功耗的优化几乎做到了极致,它整合了业界最先进的技术与之一搏,包括最先进的晶体管结构、最小的晶体管尺寸、最低功耗的处理器架构、最先进的芯片封装技术以及最优的内存数据调度技术,所有这些,都是为了正面阻击芯片的耗电,期望能让消费者获得尽可能长的待机时间和最佳的发热体验。
首先是5纳米的晶体管结构,它来自加州大学伯克利分校的胡正明教授提出的一种鳍式晶体管(FinFET)。这种晶体管从22纳米开始成为主流,并会一直延续到3纳米。早在上世纪90年代,传统的平面晶体管即便在关断时,仍有很大的漏电流,导致芯片发热急剧增加。业界预测,当晶体管尺寸缩小到100纳米时,晶体管将变得像火山口一样滚烫!摩尔定律将不得不止步于此。即便迈过了这个坎,晶体管继续缩小后,芯片将变得像火箭喷射口那么烫。到那时,即便是最先进的水冷技术也无法让热量散发出去。在飞往日本的飞机上,胡正明匆匆画下了一幅草图,成了后来的三维立体FinFET。
FinFET晶体管
从2011年起业界开始转到FinFET。这种晶体管一改之前平面晶体管只能从一个平面上关断晶体管,而是从三个平面上关断晶体管,大大减少了漏电并降低了芯片的耗电。
另外一个严重影响芯片耗电的重要因素是晶体管的工作频率。自从1971年英特尔的法金和霍夫发明的第一颗CPU芯片后,芯片工艺节点从当时的10微米(即10000纳米)缩小到现在的5纳米。随着晶体管尺寸缩小,相邻晶体管之间的距离也缩短,信号延迟变得更小,从而提升了CPU的执行速度。
根据IBM的登纳德的推算,摩尔定律每前进一代,晶体管尺寸缩小30%,速度和工作频率提升40%。1971年的CPU 4004的工作频率只有740 kHz,而到了2005年已经升高到了3GHz,提高了4000多倍。但从此以后,这个频率一直徘徊在3~4GHz。因为芯片的工作频率越高,消耗的功耗就越大,消耗的电力转换为热量,即便有了风扇也难以散去。
2005年以后,芯片的频率不再提高,苹果Vision Pro中使用的M2芯片的频率也只有3.49 GHz,这是为了降低耗电不得不做出的让步。
当处理器芯片的频率不能继续提高后,提高处理器性能的主要途径就剩下增加晶体管数量。但是处理器芯片的功耗会随着晶体管数量的增加而成比例增加。更糟糕的是,芯片性能只能随着晶体管数量的平方根而增加。例如,晶体管数量增大为4倍,功耗也会增大为4倍,但性能只能增大为2倍。这样单纯增加一个内核中晶体管数量就变得很不划算。
由此,提高处理器性能的方式就剩下了增加内核数量,即采用小内核保持功耗不变,同时增加内核个数以增加晶体管数量。从本世纪初的单个内核,逐渐增加到双内核、四内核。苹果的M2芯片也沿用了这种思路,它包含了8个CPU内核和10个GPU内核等。但是内核数量越多,所需的并行处理就越复杂,所以内核数也不可能无限增加。
苹果M2芯片中使用了多核CPU和GPU
此外,苹果的M2芯片还采用了低功耗的ARM架构来降低耗电。说起ARM内核,它跟苹果公司还有一段不浅的渊源,可以追溯到1990年。
那时苹果准备开发一款前所未有的设备:个人数字助理(PDA),它选中了英国剑桥一家在谷仓里的小公司安谋(ARM),并联合了另外一家公司成立了合资公司,共同开发ARM处理器。后来PDA产品失败了,乔布斯也从苹果出走。但是得益于ARM处理器极低的功耗,ARM处理器在上世纪90年代在手机中流行开来。
乔布斯重新回归苹果后,在iPhone中大量使用低功耗的ARM处理器,甚至从2010年起,苹果公司不惜得罪英特尔公司,将每年数千万台新生产的Mac电脑中的处理器也换成了ARM处理器,让英特尔的股价暴跌。英特尔公司的CPU采用的是复杂指令集CISC,每条指令很长,导致功耗大。而ARM处理器采用一种精简的指令集RISC,每条指令更短,指令长度相等,可以反复使用,从而大大降低了功耗。
即便采用了这些降功耗的措施,苹果公司还觉得不够。
在M2芯片中,CPU、GPU、内存等都通过SiP技术封装在一个基座上,减少芯片之间的互连线长度,从而降低驱动所需的电流。进一步,苹果的M2芯片中的CPU和GPU采用统一的内存架构,这样就可以共享内存中的数据,而不需要将数据在CPU和GPU之间搬来搬去,进一步降低了功耗。
当然,R1协处理器也为降低功耗发挥了重要作用。当Vision Pro处于待机状态或者较闲时,主要是R1协处理器在处理传感器等的数据,这样就不需要启动高耗电的M2处理器,而让它处于休眠状态。R1处理器就像一个大内总管,把核心计算以外的任务都包揽了下来,大大降低了M2处理器的耗电。
03 追随摩尔定律
从苹果开始研发Vision Pro到现在已经过去了7年。在这么长的时间里,摩尔定律已经前进了3代,苹果也有足够的时间去反复修改Vision Pro的架构、指标以及综合比较各种能降低功耗的技术。可以说,在这个时间节点上发布,苹果已经竭尽全力,它整合了世界上最好的芯片技术:5纳米的工艺、M2强大的芯片整合能力、R1优秀的低功耗技术等,可谓使出了全部看家本领。
尽管这款Vision Pro头显功能强大,但高达3499美元的价格,注定了它的玩家只能是小众群体,更不必提极高的耗电水平又会让不少人打消购买的念头。那么为什么苹果仍执意要发布这款产品呢?
因为苹果赌定了一点,那就是摩尔定律在未来若干年会继续前进。尽管现在这款头显耗电严重、发热大、价格昂贵,但只要摩尔定律仍在前进,每过一代芯片性能就会翻倍、或者价格减半。而且接下来的3纳米或2纳米晶体管会采用漏电更少的围栅结构(GAA or nano-sheet),进一步降低耗电。此外,芯粒(Chiplet)技术也在方兴未艾地发展,会进一步提高芯片集成度和性能。在神经网络计算中,近年来新兴的张量处理器(TPU)的运行效率会更高。
GAA(Nanosheet) 晶体管
所有这些,都是苹果敢于赌定未来的依据。即便在更远的将来晶体管尺寸不再继续缩小了,芯片还能以三维集成的方式将CPU和存储器集成在同一个裸片上,继续增加晶体管的数量。而更紧密地集成在一起的CPU和存储器,它们之间的互连距离也会进一步减小,从而降低功耗。所以说苹果发布Vision Pro,其实是在赌摩尔定律会继续赢,它寄希望于那些充满意志坚定且创意的工程师会继续发明出性能更强的芯片,而且价格和功耗会更低。
当然,谁也没有把握说苹果一定能赢,这注定是一场豪赌。如果苹果赌赢了,若干年后,当苹果再次发布新产品时,我们或许早已习惯了在180度环绕的立体曲面空间上体验那种逼真而触手可及的奇妙感觉。
关于作者
《芯片简史》
*作者汪波是芯片研究专家,科普作家,在华为公司、法国里昂纳米国家实验室和北京大学深圳研究生院有二十多年的研究和教学经验,著有《芯片简史》、《时间之问》和《时间之问·少年版》。更多关于芯片的历史可参阅《芯片简史》。