国产AI芯片,竟能比肩英特尔?

由于在算力、能耗、车规、量产等方面的诸多挑战,在AI芯片领域,自动驾驶芯片常被比作其中的珠穆朗玛峰。

面对这个AI芯片的制高点,各家公司可谓各显神通,无论是谷歌、英特尔等计算平台巨头,或是特斯拉这样的新秀,还有做单点技术的初创公司,都在不断尝试在自动驾驶芯片上寻求突破。

近日,地平线发布了其在在自动驾驶芯片上的最新进度:新一代车载AI芯片征程3。

这家成立于2015年的公司,是国内AI芯片领域的先行者,它在2019年发布了中国首款车规级AI芯片征程2,并实现了规模性量产。

在过去的5年内,地平线成为了中国自动驾驶AI芯片的代表,它的一举一动,不但牵动着整个行业,也决定了中国自动驾驶芯片在世界的话语权。

自动驾驶芯片的演化

自动驾驶的实现,是传感器数据融合、深度学习、车联网、地图、人机交互等多种技术耦合的结果。

在这其中,芯片是贯穿始终的。在芯片硬件的选择上,最早人们使用MCU/CPU/DSP等芯片,后来发现GPU在图像处理上的优势,让GPU芯片成了用于技术研发主流。

以显卡闻名的英伟达开发了价值数千美元的PX2计算平台,里面包括2个独立的GPU,12个CPU核心,16nm制程,水冷系统等等,性能上相当于150个MacBook Pro,一次能搞定8颗传感器(相机、雷达和超声波传感器)传输的数据。这在传统汽车上是完全见不到的。

这类高性能芯片,往往需要大量的计算资源,它们普遍存在能耗高、发热严重、噪声大等问题,配套散热设备后,往往会大幅挤占汽车后备箱的空间,无法满足嵌入式的要求。

即便是英伟达这样顶级GPU大厂,在满足超高算力的同时去降低高能耗也显得捉襟见肘、狼狈不堪。更进一步的讲,对于现在的通用型计算平台而言,要么选择超高算力,要么选择超低能耗…鱼和熊掌不能兼得。

于是,行业出现了新的芯片解决方案,除了传统的GPU外,还出现了FPGA和ASIC。通俗来讲,这三者的关系可以理解为从“通用”→“专用”的进阶。

CPU的通用性最强,可以胜任很多工作,但在解决计算机视觉信号上,效率比不过GPU,而GPU在某些方面又不如专用的ASIC芯片(专用集成电路,意思就是面向专门计算用途打造的芯片)。

英伟达推出的PX2,曾用在特斯拉的车上,2019年4月,特斯拉推出Autopilot 3.0系统,就是基于自研的ASIC自动驾驶芯片。

据马斯克透露,这款专用芯片能以不到100瓦的功耗输出144TOPS的算力,比英伟达的PX2有10倍以上的能效比,“也就是说,在相同的能耗和成本下,它的工作效率将会提高10倍。”

车企其实不一定非要自己研发芯片,与科技厂商合作研发是当下大多数传统车企所采用的路线。比如英特尔和宝马收购了Mobileye并与宝马、克莱斯勒等车企结盟,小鹏等多家公司也继续沿用了英伟达的方案。

特斯拉自研芯片的考虑首先是对于成本的控制,以Dirve PX 2为例,单块价格为1.5万美元。特斯拉有全球最大的电动车保有量,自研芯片+代工的模式,虽然短期成本投入比较大,但长远来看是相当划算的买卖。

同时,自研芯片也可以让车企具备核心技术,提高护城河;可以让自己的算法在一个更加合适的平台去实现价值。

虽然好处多多,但是芯片开发的成本是巨大的,而且回报周期很长,如果没有相当足的技术积累、体量,和在自动驾驶上的决心,可能绝大多数车企都不会去效仿特斯拉。

地平线的商业化路径

回到中国的自动驾驶芯片,地平线一直致力于低功耗的边缘AI芯片,通过算法和芯片的深度整合,提升芯片有效算力,在同等性能的情况下大大降低功耗和成本,保证实时性。

相比于高性能芯片,地平线的方案可以做到快速部署,在成本和推广上有着先天的优势。

高性能芯片虽然算力更高,但受制于成本法规等因素,目前能实现的功能有限,比如小鹏P7中搭载的英伟达DRIVETM AGX Xavier,虽然运算能力达到了30 TOPS,但功耗也高达30W,根据小鹏的介绍,P7可以实现:在特定高速公路设定导航目的地,P7将根据路线指引,实现自主变道、切换高速路线,并在行车中实时选择最优路线。

相比于Mobileye推出的EyeQ4辅助驾驶芯片和征程3,Xavier不仅成本更高,高速中的辅助驾驶也存在诸多限制。

地平线切中的正是中国的乘用车现存市场,虽然存量市场有对于智能化和自动化的需求,但国内能提供解决方案的公司却寥寥无几。

目前征程2已经在奇瑞蚂蚁SUV,和长安汽车UNI-T车型上使用,地平线已签下20余个前装定点项目,预计装车量可达数百万台,2020年内将有6款搭载地平线车载AI芯片的量产车型上市。

地平线已与广汽研究院,广汽资本签署战略合作协议,计划在未来的车型中搭载征程3芯片。

作为最新的产品,征程3从28nm转换到了台积电的16nm工艺,AI算力达到了5 TOPS。

地平线CEO余凯表示,“如果我们对标这几个芯片,比如英伟达Xavier、TI TDA 4,我们的功耗可以做到他们的1/10,仅为2.5w。而我们的AI计算可以实现每秒钟422帧。”

事实上,征程3的性能已经超越了行业翘首Mobileye的EyeQ4系列芯片(以3W的功耗,实现2.5Tflops的计算性能)。

和前代征程2主打的智能座舱功能不同,征程3可以实现自动泊车、驾驶员监控、辅助驾驶、智能座舱等功能,可实现更高的图像处理能力:
支持4-6路camera接入;支持4K@30fps图像处理;HDR宽动态;支持3D降噪、畸变矫正;支持3A(AE/AWB/AF)功能。

总体来看,征程3依然是应对当下中国自动驾驶市场的一款产品,配套目前主流的摄像头、毫米波雷达传感器,能在很多量产车上实现自动泊车等非常实用的功能。
同时,为了促进芯片的落地,地平线也为Tier1和主机厂提供了更加开放的工具链,以更好地将视觉感知产品与其他传感器融合,实现更多效果。

而应对中国未来市场对更高等级的自动驾驶需求,地平线计划在明年年初发布征程5,单芯片算力达到96TOPS,搭载这款芯片的量产车型可能会在2022年第二第三季度推出;而征程6的算力更是到达400TOPS。

当初,基于人们对于自动驾驶的想象,各种高算力平台层出不穷,但此后人们逐渐意识到完全形态的无人驾驶遥遥无期,“辅助智能驾驶”就成了行业落地,进行商业化的关键。从2018年开始,行业人士愈发意识到自动驾驶落地的重要性,开始寻求更容易实现,更具性价比的解决方案。

地平线就是其中一个代表,用足够的算力和低功耗低成本等思路,在中国自动驾驶市场找到了真正落地的机会,让它有实力和资本去尝试更多的可能,也让未来自动驾驶芯片的全球竞争中,不缺乏来自中国的力量。