作为Imagination的股东和超级大客户,苹果公司的A系列处理器一直在用PowerVR GPU核心,去年的iPhone6s的A9及性能更逆天的iPad Pro处理器A9X都用了最新的PowerVR 7系列GPU。今年苹果还会推出iPhone7手机,处理器会升级到A10,现在A10的GPU核心也有着落了,因为Imagination在CES展会上发布了性能更强大的PowerVR 7XT Plus系列GPU,整数性能最多提升3倍,还支持了OpenCL 2.0通用计算。
与ARM的Mali GPU核心架构多年不升级一样,这次的PowerVR 7XT Plus系列同样也没有对核心架构做大幅改动,还在用成熟的Rogue架构,硬件单元是改进而非换代,在保持PowerVR 7XT系列完整功能——比如支持OpenGL ES 3.2、Vulkan、硬件虚拟化、安全等的基础上,PowerVR 7XT Plus核心增加了一些新功能,主要是增加了用于视觉计算的整数单元,同时支持了OpenCL 2.0规范,提升了通用计算性能。
▲PowerVR 7XT Plus架构示意图
官方提到PowerVR 7XT Plus增加的整数单元对性能提升非常大,之前的Rogue架构只支持INT32计算,PowerVR 7XT Plus现在支持INT16及INT8数据路径,因此部分视觉应用中性能可达之前的4倍。
此外,PowerVR 7XT Plus中还新增了一个图像处理数据管理器(Image Processing Data Master),适用于无需几何及贴图处理的2D图形及图像处理应用,这样可以节省功耗。
第二个方面就是改进了系统性能,优化了功耗,包括支持最新的总线接口、翻倍了内存突发单元大小、调整了缓存容量和效率,减少了10%的带宽需求。
第三点改进就是支持OpenCL 2.0通用计算规范,这个是为异构计算准备的,它还改进了共享虚拟内存支持,现在主CPU和PowerVR 7XT Plus GPU核心可以共享指针,消除了不必要的数据复制过程,还降低了延迟。
在OpenCL 2.0中,官方演示的一个例子就是动态并行(dynamic parallelism),现在可以在无需CPU参与的情况下动态创建新的GPU进程了。
▲动态并行演示
这些功能到底有什么用呢?在最近的一次嵌入式视觉联盟会议上,中国的百度公司演示了一个基于DNN深度神经网络的应用,它可以通过镜头实时鉴定出用户拍的是什么东西,就是下面图示的那样,你拍了某个路人的衣服,软件就会识别出同款衣服和包包在哪里买。
其他功能就不一一细说了,目前Imagination发布的PowerVR 7XT Plus核心的GPU是T7200 Plus和T7400 Plus,级别还不算高,更高端的产品应该会陆续发布。考虑到苹果的iPhone7手机还要等到9月份问世,A10处理器上用上PowerVR 7XT Plus核心的GPU应该是没跑了。