Tensilica今日宣布,推出一款图像和视频数据处理器(DPU)IVP,IVP是处理移动手持设备、平板电脑、数字电视(DTV)、汽车、视频游戏及基于计算机视觉应用中的复杂图像/视频信号的理想选择。IVP DPU在功耗和性能方面实现了突破,基于可编程处理器产生了很多前所未有的应用。IVP得到众多第三方应用开发商的支持,将领先的图像应用移植到IVP平台,包括创新的多帧图像捕捉、视频预处理和后处理算法,以及不断发展的新技术,如视频稳定、高动态范围(HDR)成像、高动态范围视频、人脸识别与跟踪、低照度图像增强、数码变焦和手势识别等。
IVP数字信号处理器具有独特的指令集用于图像和视频像素处理,相比单发射的主控CPU,IVP单条指令至少可以完成16个16位的像素操作。其复合指令带来了10-20倍的性能提升以及更低的功耗。IVP丰富的指令集拥有超过300条图像/视频专用向量指令,每个周期可以完成32个或更多的16位像素处理操作。
Forward Concepts公司总裁兼首席DSP分析师Will Strauss表示:“随着移动摄像头数量的增多,视频和图像的高级处理需求也在增长,这种负载应该从主控处理器分流出来,以保证最佳性能和最长的电池使用寿命。随着图像与视频处理的创新步伐加快,Tensilica的IVP处理器可以帮助客户高效的设计出专用算法加速芯片,从而可以更快地面市、且降低升级算法的额外支出。”
Tensilica创始人兼首席技术官ChrisRowen表示:“消费者需要像HDR一样卓越的成像功能,但目前的处理技术速度太慢,连拍间隔需要数秒钟。用户希望速度能提高50倍,而Tensilica能提供消费者想要的:即时的,高品质的图像和视频捕捉。IVP架构支持超高品质的图像和视频捕捉,具备先进的单帧和多帧处理能力,以适应日益增加的传感器分辨率。这是一款令人兴奋的、为未来而准备的、理想的新产品。”
高效的处理器架构
Tensilica的IVP是一款基于4路VLIW(超长指令字)架构,提供高并行性,长短代码指令无缝混存,并支持32路矢量SIMD(单指令,多数据)运算的处理器。为了跟上快节奏的分辨率和单帧速率的要求,该架构包括了一个集成的DMA(直接存储器存取)传输引擎,拥有高达10 GB /秒的吞吐量。本地存储器每个周期吞吐量为1024比特(64*16像素/周期)。IVP还有许多特有的图像处理功能,可以加速8 位、16 位和32位的像素数据和视频采样处理。
IVP的能效非常高,在28nm HPM,RVT制程下,采用自动综合,布局布线流程,完成1080p30帧16bit像素整体图像处理的功耗仅为10.8 mW。整体图像处理是人脸和物体检测以及手势识别功能中最常用的算法。
IVP的高性能体现在可以实现复杂的算法,例如动作检测和规格化互相关运算,常用于高精度的模块及特征匹配和光学处理流程中。以动作检测为例,采用256*16像素的搜索范围和9*3像素的模块大小,处理1920*1080像素的16bit数据,IVP每个周期可以找到142处差异点。而对16位像素数据进行32位精度的规格化互相关处理,可以每秒完成1百万个8*8模块的计算。
软件
许多公司专利化的图像和计算机视觉处理算法,都能够顺利在IVP上运行,因为IVP具备TensilicaDPU通用的C语言编程模式。Tensilica还建立了合作伙伴网络,为客户提供移植好的,高效的第三方图像处理算法软件。已经将其先进的图像处理算法移植至IVP DPU的公司包括Almalence、Irida Labs、Dream Chip Technologies和Morpho。
Almalence总裁EugenePanich表示:“采用Tensilica先进的工具套件,可以轻松对自有算法进行编程,实现更高的性能和差异化。将软件算法移植到Tensilica的 IVP处理器上是件轻松愉快的事情,Tensilica的编译器拥有强大的性能,是我们使用过最好的工具。Tensilica的整个工具链质量都非常出众”。
Irida Labs CEOVassilisTsagaris表示:“我们很高兴能够与Tensilica合作,与其他平台相比,IVP大幅提升了我们的嵌入式视觉应用性能,例如视频稳定器的电源效率获得了很大提高。IVP是分流图像处理负载的最佳选择。”
差异化定制
Tensilica的IVP DPU能够采用Tensilica的专利处理器配置技术进行进一步定制。
设计生成DPU的过程完全自动化,并且每个DPU都有匹配的软件工具链支持。工具链包括一个优化的编译器、链接器、汇编器和调试器,以及相应的快速指令集仿真器。
供货情况
第一批客户于去年收到IVP交付使用,IVP DPU目前已获广泛授权。