德州仪器(TI)首次在其汽车SoC添加了一个专用深度学习加速器。TDA4VM的开发套件以及预生产设备已经可用。预计将于2020年下半年开始量产。
从这一举动,我们可以看到深度学习技术在汽车ADAS系统中正日益普及。
一、TI中端ADAS处理器首次包含专用AI加速器
新的深度学习模块基于TI全新的C7x DSP IP以及其内部开发的矩阵乘法加速器。
TDA4VM是Jacinto 7系列产品中首批推出的两个SoC之一,它结合了传感器预处理和数据分析功能,可处理800万像素前置摄像头系统的输入。
另外,TDA4VM可以同时处理4-6个300万像素摄像机,这些摄像机还能与雷达、激光雷达和超声波传感器的输入同时工作。
这些摄像头和传感器可启用高级驾驶员辅助系统(ADAS),如自动泊车。深度学习可用于融合来自不同传感器的数据,或启用目标检测之类的技术。
二、第一款带有C7x DSP的SoC
在德国慕尼黑举行的TI新闻发布会上,EETimes Europe与TI处理器业务副总裁兼业务部门经理Sameer Wasson以及TI Jacinto产品线总经理兼产品线经理Curt Moore进行了交谈。
▲Sameer Wasson(图片来源:TI)
“这是第一款带有C7x DSP的SoC。” Moore介绍道,他们添加了用于计算机视觉的矢量指令,并认识到,难点在于如何将大量数据存入SoC或数学引擎中、如何处理数据以及如何将其提取出来。
新型C7x DSP专用于处理大量数据,并在高难度的实时环境中执行复杂的数学运算。DSP的数据流功能与矩阵乘法加速器相结合,可促进深度学习应用更加高效。
Wasson说:“我们亲切地称其为MMA。如何在库中使用它有不同的情况……我们有TIDL(Texas Instruments Deep Learning),它是抽象层MMA复杂性的顶层,您可以通过它进行编程。但是它的优点在于C7x与之交互的方式,以更快地获取和输出数据。”
TDA4VM适用于5W至20W功率的ADAS系统。Wasson表示,实际上,前置摄像头系统的电源设计通常低于7W,但同一SoC还适合更复杂的系统,例如自动代客泊车,其功率可能接近20W。
TI的部分建议是,使用像这样的高科技SoC实际上可以降低诸如前置摄像头系统等应用的系统成本。
“如果您拥有正确的深度学习,则可能不需要立体声相机。” 据Wasson介绍:“您可以使用价格较低的低端镜头来做到这一点。因此,对于OEM或Tier 1来说,成本要低得多,但那里的引擎可有效地对其进行补偿,并提高性能。”
三、算力可达8TOPS
TDA4VM中的深度学习引擎算力可达8 TOPS。作为Jacinto 7系列的第一部分,Moore表示打算按照计算能力将其划定为中间范围的部分。未来的设备将高于或低于这一范围。2 TOPS的未来部分可能对计算密集度较低的功能有用,比如驾驶员监视或占用检测。
▲Curt Moore(图片来源:TI)
“汽车市场的美丽之处之一是所有这些用例并存。” Wasson说:“即使OEM提供了一个全新的、更新的平台,在同一平台上也共存不同的汽车系列。最大的挑战是如何使它们与软件兼容……如果您构建最可扩展的平台,并使用不同的用例扩展SoC,那么现在您已经给了他们一个画布,他们可以在其中进行表达。”
Moore描述了预期拥有ADAS功能的广泛车辆,价格从10-12000美元开始,到100,000美元甚至更高。
“这些车辆的驾驶员有不同的期望。”他指出,在售价100000美元的汽车中使用3000美元的ADAS系统,与在零售价为12,000美元的汽车中安装相同的3000美元系统完全不同。
在他看来,这些公司面临的另一个挑战是,如果您想到一家大型汽车公司,他们的(发展计划)可能会达到每年一千万美元。手机制造商制造几种型号,并且出货量达数千万,与手机制造商相比,他们必须摊销相对较少数量的车辆开发成本。