来源:量子位
雷刚发自凹非寺
量子位报道公众号 QbitAI
你听过从实时视频里“抹掉”一个人的神迹吧?很费 GPU 的那种,需要很强 AI 算力的那种,现在手机竟然就能做到了——还可以替换另一个人上去,青出于蓝。
我,见惯了 AI 风云的量子位吴彦祖,看完这样的下一代旗舰安卓手机,
依然感叹前所未有的强大,兴奋又激动。
因为你的下一代手机,息屏放着,没有专门打开任何应用,但听到婴儿的哭声会提醒你。
也可以根据你所在场景的不同情况调整设置,比如“感觉”你走进了会议室,自动给你设置成静音状态。
是的,你的手机,随时在线,始终准备响应,不需要你任何唤醒和下命令。
而且这不是科幻,也不是什么渲染宣传。
因为它明年就会出现在各大安卓旗舰手机中,它就是刚刚推出的骁龙 888 的 AI 能力。
隐形主角,后知后觉
说实话,在骁龙 888 发布当时,大家都是一窝蜂冲着拍照、游戏和性能提升去的。
现如今手机,不就是在革新手机的拍摄和游戏体验的道路上越走越远嘛?
然而,越往后,更多人开始发现骁龙 888 带来的 AI 革新,堪称隐形主角。
外媒 Venturebeat 甚至评价,骁龙 888 实现了其在 AI 表现上的最大飞跃,果然是高通移动 AI 皇冠上的新明珠。
还有好事者,横向对比了年度几大手机旗舰芯片……
最后结论是骁龙 888 在性能提升上,以 26TOPs 的算力,盖过其他友商,可以说是新一代地表最强 AI 芯。
要知道,之前业内各家的性能提升,虽然每一次相互突袭,但都讲武德,都是基于上一代渐进式提升。
而这次骁龙 888,直接从上一代 15 TOPs 进化到了 26 TOPs,每秒 26 万亿次运算。
这种高性能算力提升,能做的自然更多,让手机更快、连视频都能实时P,放十年前估计得动用超算。
但要是光靠性能提升,骁龙 888 也不会在第一波热议焦点后翻红。
更主要的是,在一边实现性能飞跃后,另一边还实现了更低功耗,每瓦特性能比上一代提升了 3 倍,甚至能永远在线。
这就有点不以和为贵了。
同样是一年一迭代,怎么今年在 AI 上就像打通任督二脉呢……
性能飞跃方法
主要靠的是软硬件一体化的提升,加一起就是高通第六代 AI 引擎。
具体来说,这次高通主要做了三件事。
第一件,新推出 Hexagon 780 处理器,架构上完全重新设计,并且实现了三大加速器的大一统。
过去,标量、向量和张量加速器,都是相互独立的。
但是在 Hexagon 780 处理器上,实现了架构融合。三者不仅在物理距离上完全融合,构成大型 AI 加速器,还添加了专用共享大内存,能够实现更高效地数据共享和移动。
这个共享内存有多大?
比如上一代足足大了 16 倍,于是三大加速器之间,切换时间达到了纳秒级,在有些应用案例中,时效比之前提高了上千倍——没错,上千倍。
如果不懂这三大加速器具体作用,其实也没关系,你可以理解为过去手机使用就像“考数学”,涉及加法就调用标量处理器,涉及负数就调用向量处理器,涉及乘法就用张量处理器。
但现在架构三合一融合,不管啥题,干就完了,比以前自然更简单直接。
而且这三大加速处理器,比以前还都更强了。
标量提升了 50%,张量提升了 2 倍,向量支持的数据类型更多了。
加上其他硬件核心的提升,比如光 Adreno 680 GPU,AI 性能就提升了 43%。新上的指令集,可以展开 4 输入混合精度点积以及波浪矩阵乘法,可加快浮点运算。
而且性能提升同时,功耗还进一步降低,每瓦特性能相比上一代提升了 3 倍之多。
所以最后,AI 性能实现了大飞跃。
但这还不是全部,更加值得关注的还有专用低功耗 AI 处理器。
这是高通在 AI 提升上做的第二件事——也可能是未来旗舰手机巨大变革的开端。
光把 AI 引擎提升,还不足以实现全天候 AI 感知。
你想现在智能手机里,拍照要用 AI,打游戏要用 AI,录音翻译也都得用 AI……一个主要的 AI 处理器都得每年迭代才行。
所以高通这次,来了一招专芯专用,上马第二代传感器中枢。
这枚专芯不用处理复杂算法,主打全天候运营、始终在线,随时待命。
为此,就需要截然不同的软硬件架构设计,这枚专用 AI 处理器,需要极低的功耗。
它整体功耗仅仅不到 1 毫安,分担 Hexagon 处理器高达 80% 的工作负载,最后仅此一项,就能帮助 AI 性能实现 5 倍提升。
比如下一代手机上,可能就不会再为 AI 助手设置专门的唤醒词了。
或许你不知道,你随口一声“小爱同学”,之前就需要专门的侦测算法,而这个随时待命的低功耗 AI 处理器,一下子能节约 38% 的负载。
当然,这颗低功耗 AI 处理器,打开的还不止这些新应用,后面我们再具体说。
最后再说说高通实现 AI 性能飞跃的第三大法宝:软件。
AI 产品题中之义的软硬件一体化,或许你已经不陌生,现在包括智能硬件等领域发生的一切,就是 AI 算法和软件对硬件的重新定义。
而高通在骁龙 888 上实现的跨越,易于看见的是硬件优势,但常被忽略软件之功劳。
在去年首次推出 AI 模型增效工具包后,高通今年又在增效工具包上下足功夫,以更好支持网络量化方面下功夫。
使用诸如 Adaround 等训练后量化技术,以及带有范围学习的量化感知训练,实现极少或几乎没有的精度损失。
还增加了对循环神经网络(RNN)和长短时记忆神经网络(LSTM)的支持。随着对混合精度运算支持的增加,开发者将能够在保持准确性的同时,最大限度提高功耗与性能的平衡。
加上进一步拓展的用于 AI 加速器的开源编译器 TVM,开发者更是用几行简短的 Python 代码,就能编写自定义算子,直接访问第六代高通 AI 引擎的核心——Hexagon 780 处理器。
所以归结起来,如果一句话回答高通 AI 性能飞跃的方法论——
那就是:加速器大一统,专有低功耗 AI 处理器,软件算法协同补强。
只是说一千道一万,这样的飞跃到底有什么用?
你的旗舰安卓新应用
先看(可能)全新的一些 AI 能力。
随时在线,更加主动的 AI 助手:
智能识别周围场景,自动化调整手机铃声状态:
比如你从吵闹的咖啡厅到安静的会议室,就会自动帮你静音,不必再御驾亲调。
未来这句“请大家提前把手机设为静音”,大概就成为历史了。
你的手机还能在没有信号的多层停车场,准确帮你找到停车位置。
背后原理,主要是那颗低功耗 AI 处理器,在你开车进来的时候,就用你的行车轨迹,实时画出了一张 3D 路线地图,不管有没有信号。
所以常找不到停车位置的朋友们有福了。
需要在停车场快速找到男女朋友的朋友,也方便了。
另外,屏幕唤醒、抬手亮屏、活动识别等等,都可能会成为标配的系统功能。
而且因为高通展现出的开发者开放态势,更多意想不到的应用,也成为可能。
比如 Tetris.AI 基于高通 AI 引擎 Direct 软件,就打造了一个超级电影应用。
在这里你可以把“自己”替换进电影中,演任何你喜欢的角色。
还有 trinamiX 开发者团队,打造了一个手机拍照就能测肤,推荐护肤品的应用。
所以此次高通 AI 性能的飞跃,实际也可以分两方面来看。
一方面飞跃来自软硬件能力迭代。
另一方面则是开源开放展现出的无穷之力,让更多奇思妙想的开发者,真正可以打造出 5G+AI 的新爆款产品。
当然,现在手机最主要的功能,已是拍照和游戏。
而 AI 在其中,自然也是无处不在,居功甚伟的。
比如拍照,1 秒内就可以捕获 120 帧,且每帧都是 1200 万像素。
逆光、实时视频会议背景优化,画面更为丰富清晰。
暗光场景,更丰富的细节和更少的伪影。
都离不开 AI 的加持。
如果离开 AI,3 ISP 合成 HDR 超画质影像,就无法实现。
也是因为 AI 之力,手机摄影都改了学名,现在是计算摄影。
并且在自动对焦、自动曝光和自动白平衡所组成的 3A 算法,本质就是 AI 能力。
游戏方面,自然是可变分辨率渲染在移动端的首次实现。
当渲染每一帧时,GPU 为每个像素执行一个着色程序来计算它的颜色。这意味着 360 万像素被着色。可变分辨率渲染允许开发人员指定着色器程序以 2 个或 4 个像素为一组仅运行一次,然后将这些颜色结果重新复用于周围的像素着色。
所以按照这个速度进化下去,未来高分辨率游戏,或许就不需要专门的游戏机和显示器了。(手动狗头)
如何评价?
最后,完整了解骁龙 888 展现的高通最新 AI 能力之后。
是时候说说观感了。
首要的自然是随着高通在 AI 软硬件上越来越得心应手,之前一些略显“科幻”的 AI 能力,现在可以成为现实了。
其次,在此次骁龙 888 的 AI 方案中,提供了一种新思路:
AI 性能及其实现,不仅要比谁强,还要拼“持久”——也就需要 AI 硬件和算法,足够低功耗。
最后,被认为史无前例的高通 AI 飞跃,也是高通史无前例的开源开放。
无论是高通 AI 引擎 Direct 开放,用于 AI 加速器的编译器 TVM 开源,都代表了一种新的趋势。
这是在 5G 商用开启后,高通对于一个崭新时代的预测。
这是一个 5G 和 AI 双引擎驱动的新发明时代,AI 推动越来越多智能能力实现,而 5G 则对终端与云端的快速稳定连接提供了保障,可以有效填补终端算力不足。
于是 5G+AI 的结合,也就让越来越多智能终端成为可能。
并且不再局限于手机。
智能能力将无处不在,可以拓展到移动设备之外,可以是眼镜、机器、车辆和任何终端。
而且这不是设想,在骁龙 888 等各大平台的支持下,Windows 10 笔记本电脑上的 AI 应用案例,以及机器人等领域的应用,也都应有尽有……
一个 AIoT 万物智能互联的时代,就在眼前。
相关推荐
© 2020 asciim码
人生就是一场修行