ASCII码 ASCII码

扎克伯格45分钟深度采访:透露下个十年VR和脑机接口野心

发布于:2021-03-10 09:34:32  栏目:技术文档

  文/李水青

  来源:智东西(ID:zhidxcom)

  没人愿意把头钻开!扎克伯格谈脑机接口和 VR/AR,高情商怼苹果。

  智东西 3 月 9 日消息,今日,Facebook 创始人兼 CEO 扎克伯格在最新接受的专访中,贡献了他迄今为止有关 AR/VR 最深入的策略分析、行业洞察和见解。

  他不仅阐述超低成本的 VR/AR 硬件战略,透露第三、四代 Quest VR 设备的新功能细节,还预判未来十年 VR/AR 设备出货量将接近智能手机。

  在交谈过程中,扎克伯格金句频出。比如谈 AR 眼镜产热时,说“你显然不想烫伤任何人的脸”;谈马斯克 Neuralink 侵入式脑机接口技术时,说“我不认为人们会为了使用 VR/AR 而愿意把头钻开”。

  相当有趣的是,不知道是不是因为在隐私和 App Store 控制方面的交火而记仇,扎克伯格仿佛忘了苹果公司叫啥,相当清楚地多次提到苹果的所作所为,就是不说出“苹果”的名字。

  在采访中,扎克伯格还隐晦地表达了对苹果严格控制 App Store 的不爽,说 Facebook 的操作系统和芯片投资,将是确保现有平台公司不会扼杀其创造力的一种方式。

  超有料的研发进展、超前沿的一线洞察,都出现在这位 VR/AR 重要人物长达 45 分钟的专访中,智东西将此次采访内容完整编译呈现。

  此次专访亮点内容如下:

  1、苹果,一家不配被提名字的公司,被“暗怼”技术不过关、卖得贵。

  2、今年晚些时候推出其第一款智能眼镜,暂不提供 AR 体验。

  3、正在设计 Quest3、Quest 4,将增加眼球追踪和面部跟踪功能,可用来定制逼真的虚拟动态头像。

  4、VR 头显 Oculus 2 活跃用户数将超过 1000 万,之后会达到数千万。

  5、下一版 VR 头显将能捕捉用户的面部表情,基于多传感器、眼球追踪技术、机器学习等技术,实现更逼真的数字虚拟化身。

  6、AR 设备比 VR 设备更难做,最大技术难点在于微型化、散热。

  7、想让脑机接口技术与在 VR/AR 输入、输出方式从根本上交织在一起。

  8、想摆脱苹果、谷歌等厂商的平台限制,通过 VR/AR 平台搭建布局,占据下一个十年的新终端高地。

  9、到 2030 年,人们将能用先进的智能眼镜“传送”到其他人的房屋,就像面对面一样地交谈。

  10、VR/AR 设备的隐藏优势是减少旅行或上下班时间,智能眼镜可以帮忙应对气候变化。

  01.

  一家社交媒体巨头,为何如此关注 VR/AR?

  扎克伯格:

  作为社交媒体,我们通过短信、图片和视频,帮助人们沟通互动。社交体验的“顶峰”是让用户感到与另一个人在一起的能力。对于这种“在场感”,现在各种技术都难以很好实现。这就是 VR/AR 所能提供的,因此我对它充满热情。

  Facebook 当下大部分业务是基于他人的平台构建的,对我们来说在下一代主要计算平台,如 VR/AR 上进行深度投资很有意义。通过自己搭建硬件平台,来确保 VR/AR 应用实现。

  这会带来许多很棒的体验。我们不再局限于给别人打电话、打视频,而是可以动动手指就隔空传送信息,和不同空间的人坐在同一沙发聊天,将游戏中的人物制作为虚拟对象进行交互……


▲模拟通过虚拟技术和不同空间的人进行交流

  这将对我们深刻关注的许多事物产生巨大影响,比如气候变暖。通过 VR/AR 技术,我们将可以更多的实现在线沉浸式交互,减少汽车、飞机的使用,是我们免于被很多通勤和琐碎杂事拖累。

  有很多理由对 VR/AR 感到兴奋,我很高兴深入了解这一点。

  02.

  公司有多少人从事 VR/AR?一年花多少钱?

  扎克伯格:

  投入很大。

  我们有很多不同产品线正在研发,其中有一些 VR 产品线。按照硬件研发逻辑,你需要同时知道接下来三种产品的外观,这与每周迭代的软件开发很不同。我们已经组建团队进行 Quest3、Quest4 的外观设计。我们研究其中的基础技术,改善光学特性和器件性能,让设备更小、更轻、功能更丰富。

  例如,我对新版本很兴奋的一点就是增加了眼球追踪和面部跟踪功能,可以用来定制逼真的动画头像。

  在 AR 方面,我们已经宣布了今年将会与雷朋联合推出的首款智能眼镜。眼镜本身不提供 AR 体验,但这有助于构建一个开发人员生态系统,用以促进该技术未来蓬勃发展。而后,经过几代人研究最终会形成未来的 AR 眼镜。

  我们也一直在公开谈论一些脑机接口的工作,当脑机接口出现将如何与 AR 进行交互?这是一个有趣的问题。玩虚拟游戏时,不需要键盘,也不用手操作来操作去。

  除了这些,还有语音和智能助手,也是其中的重要部分。脑机接口在输入、输出方式方面将与 VR、AR 的工作从根本上交织在一起。

  总的来说,你可以看到我们正在做这些不同的工作,加起来会花不少钱。许多是基础技术和研究,将来会开发出多种产品。这是项大工程,但我们在此不确切的公布人数、预算。

  03.

  个人花多少时间在这项工作上?

  扎克伯格:

  我认为这是社交体验和计算平台的未来,自己非常专注于此。我通常一周连一周花时间在上面,这也取决于周围发生的其它事情。显然,我事务繁多。

  不仅是 CEO,对大多数人来说,人生就是不仅对正在发生的事做出反应,还应努力朝着前进方向努力。

  我会说,在好日子力我会花更多时间在 VR、AR 上面。当然,也有好几周我没花时间在上面。但我们有一只出色的团队正在努力。小组负责人 Boz (Andrew Bosworth )长期参与构建 Facebook 多块业务。后来我意识到这是我重点关注领域时,我聘请了一位打造 VR、AR 消费产品的高管。

  04.

  对 Quest 2 评价如何?

  为什么认为 VR 开始起飞?市场有多大?

  扎克伯格:

  Quest 2 将成为第一款主流 VR 耳机,它发布之后很快超越了 Quest,我认为出于多种原因。

  产品进行了重大改进,更轻、更快、屏幕更好,同时更便宜,售价 300 美元,比 Quest 还低 100 美元。内容生态系统和开发人员生态系统也在建立。

  过去一年,由于“非接触”生活方式,我更多地用 VR 与朋友社交。《亚利桑那阳光》、《Onward》和《人口第一》等都是很不错的游戏。

  购买 Quest 的价值会随着时间增加,因为随着生态发展会有更多的内容及更新。在过去一年半中,我们做的一件大事就是向 Quest 中添加了手动追踪功能,只需要通过无线方式付费使用,现在效果不错。

  我一直相信,当你使用的 VR 吸引了 1000 万活跃用户时,市场就足够大了,会回馈开发人员。一开始,我们投入很多资金来补贴优秀开发人员。现在,随着我们越来越接近(1000 万活跃用户),更多的开发者也被这个生态吸引。

  随时间推移,机会是巨大的。它(活跃用户数)将超过 1 千万。我认为它会达到数千万。就像在游戏方面,Xbox 和 PlayStation 的受欢迎程度一样。而后,我们再考虑添加 AR 应用。

  VR 和 AR 是一枚硬币的两面。戴上 AR 眼镜,你可以看到远方的朋友传送到你的沙发,一起聊天。当你关闭 AR 功能,又可以用眼镜访问 VR 内容。我认为,这将是杀手级应用,前景就是下一代计算平台(可以理解为智能终端)。

  我们一旦让 AR 设备的成本降低到所有人能负担,这将惠及数亿、数十亿人口。

  05.

  什么时候意识到 AR 和 VR 一样重要,

  甚至更重要?

  扎克伯格:

  这一直是我们的观念。当 Oculus 团队加入我们时,我们认为 VR 设备可能比 AR 设备更好做,但现在开始做 AR 也很好,因为 VR 和 AR 实际上是同一个生态系统。很多人想到的是 AR,但你要想的是未来。

  只要保持手指划过触及信息,交流就会容易很多,你就能做很多事情。我们非常专注于 AR,我们还认为 VR 将成为 AR 构建方式的重要组成部分。

  我们思考的切入点是所有吸引人注意力的屏幕,包括电话、电脑、电视等,人们花大量时间,沉浸在媒体、游戏等体验中。

  当我们进入全面 AR 时代,我认为其中的 VR 成分将比人们想象得更多。

  VR 技术中的显示器、芯片等很多来自智能手机技术栈得演变,产业链比较成熟。AR 显然是不同的赛道,目前任何消费电子中都没有这一技术,它可以拥有一种透明的屏幕,不仅可以呈现对象,还可以把对象放置在现实三维空间的各个点上,尺寸小到可以放进一副眼镜。

  我们没有将投影仪放进眼睛框中的技术,AR 是一条需要构建的完全不同的技术道路。我认为围绕 3D 和空间计算以及生态开发将首先围绕 VR 进行。

  等到能够构建 AR 硬件时,生态开发系统已经比较成熟。我一直将 VR 视为 AR 彼此的延伸,而不是仅仅思考 AR 一面。

  06.

  要在未来做成一款兼具 VR、AR 的新终端,

  团队当下面临最大的挑战是什么?

  扎克伯格:

  就像我刚才说得,用于 AR 的技术完全不同。光学元器件、投影仪、显示器以及围绕它们的微型化方面有很多基础技术开发。开发它们最大的障碍之一就是散热问题。

  彻底避免发热很难。你显然不想烫伤任何人的脸。我们正在解决这些技术挑战。

  在 VR 方面,我们最关注的问题是,如何集成更多的传感器,从而实现更好的交互体验。运行传感器需要更强的 CPU 能力,并产生更多热量。我们也很想让用户能够拥有逼真的虚拟形象,在虚拟形象上表现真实的表情,与对方进行真实的目光交流。

  这需要什么?需要眼神追踪技术,需要对人的表情有一定的研究,才能使得表情制作更自然。建立虚拟形象(化身)是我们大量投资的事情。制作虚幻引擎的公司 Epic 就刚发布了一款创建虚拟人类头像的工具,原本设计师需要渲染几周的活,他们只需要一天。而后,我们还需要开发技术和机器学习来批量生成这些化身。

  虚拟化身系统的下一个版本将于今年在我们的头显上发布,随时间推移它将越来越逼真。

  当我们展望十年后的头显,一定是希望它更小巧,并且戴上头显看到周围的常见和真实世界一样清晰、鲜活。背后也有众多挑战。

  现在头显的分辨率很好,但不是视网膜分辨率。即便能再未来几年实现视网膜分辨率,也存在一个问题,即如何使用设备上的芯片为视网膜分辨率水平的实时场景供电,而避免高发热?那是不可能的。显然,这个问题要解决。

  这样一来,VR 所面临的挑战就与以往的手机、计算机所面临的挑战不同。

  另外,在当下的 VR 中,显示器上基本上只在一个焦距上投射物体。人眼会尝试变焦观看,但画面本身只在一个焦距投影,因此看不清的东西就是看不清。这一需要解决的问题,称为“变焦”。有必要创建某种液体透镜或者机械移动透镜等技术,来实现变焦。

  但是,就显示来说最困难的挑战,可能还是“高动态范围”。当下,电视在 HDR 成像方面有一些改善,但是,但是屏幕的生动度(以单位 nit 来测量)与你的眼睛在现实世界中看到的相比,就差了一个数量级或更多。

  你可能不会希望立刻就进入这样的 VR 世界,因为色彩、画面生动感都不太满意,VR 中的一切都还有些沉闷。

  07.

  声音对于 AR 眼镜有多重要?

  为此做的最有趣、有价值的工作是什么?

  扎克伯格:

  为了传达一种身临其境感,就像你与另一个人在一起或在另一个地方,空间音效非常重要。

  如果我们进行一个 Zoom 视频会议,我基本上能听到你的声音从我面前传来。但实际世界中,声音来自我们四周。对事物所在位置的空间感,对我们处理世界和记忆事物的方式非常重要。

  过去一年,我经历过很多类似现象。我们进行了更多的视频会议,我也用 VR 技术参加很多会议,即便是相对基础的虚拟形象,即便无法进行真正的眼神交流,VR 中人们周围有空间感是多么的强大。显然,当前视频会议要比 VR 有更多的东西。

  我认为确实被低估的一件事是,当进行 Zoom 通话,你有一个格子。你并不觉得自己有空间感,对吧?如果你在我左边的格子里,那不意味着我在你右边的格子里。我们没有共同的空间感。

  当我度过一天——有 5 个、6 个或 10 个会议或诸如此类——所有这些都混合在一起,我不觉得自己和一群人处于一个独特的空间里。

  但我在 VR 中的会议能做的更多,你实际上是和人们围成一圈坐着或站着。

  在 VR 中,如果你在我的右边,那就意味着我在你的左边,所以我们有共同的空间感。当你说话的时候,声音是从我的右边传来,这个事实进一步证明了这一点,这实际上是你记住的东西,是我们大脑中一种微妙提示。它这能帮你更好地安排整个对话,让你感觉更真实。

  08.

  谈谈 2019 年收购的脑机接口公司 CTRL-labs?与 VR/AR 业务什么关系?

  扎克伯格:

  在 CTRL-labs 加入我们之前,我们一直致力于脑机接口类型的工作和相关研究。他们绝对是一支世界级的队伍,自他们加入了我们以来,我们也付出了很多努力。

  我们正在考虑如何将其 VR 和 AR 输入的一部分,会包含所有这些不同的部分,其中一些是控制器,一些是手,一些是声音。随着时间的推移,将有一个重要的方面——脑机接口。

  问题是,构建脑机接口的最好方法是什么?

  不同的人尝试过很多不同的策略。我们早期研究的一些东西和一些大学教授研究的东西是,可以直接从大脑的血流中提取一些信号吗?

  通常你会佩戴某种带子,这是无创的。比方说,有没有可能在眼镜臂或 Quest 的带子上安装一个东西,来尝试读取你想要给计算机的命令的信号?

  有些早期结果看起来挺有趣。一些研究人员会给一个人展示一些图片,比如这是大象、这是长颈鹿等等,他们能查看随后的基本扫描结果,然后说:“好,现在想想这些动物中的一个。”接着他们就能相当准确地识别出这个人在想什么动物。

  你也许能通过这种方式获得一些信息。最终,我认为这种能力是有限的,因为很多发生在大脑里的事情并不是发生在表面上的。我认为从长远来看,以这种方式读取东西可能不会是未来趋势。

  有什么更好的信号采集方法?伊隆·马斯克的脑机接口公司 Neuralink 采用侵入式脑机接口方法。我们不认为人们会为了用 VR/AR 而愿意把头钻开。

  这种研究确实是有一席之地的,特别是修复学,对于受伤的人,这个方向的一些研究非常惊人。我很高兴有人这么做。但归根结底,我想短期内这不会成为消费产品的一部分。

  我们正在研究的基本理论是,正确的解读方法是大脑通过运动神经元向身体发出信号,来控制身体的不同部位。事实证明,你的运动神经元实际上有额外的能力,这是神经可塑性的一部分。如果你的大脑受伤了,你可以重新调整身体的工作方式。

  这样你就有了一些额外的运动神经元,可以适应控制不同的东西,无论是控制手、虚拟操纵杆、虚拟键盘还是类似的东西,这最终能让你可以像有第三只、第四只虚拟手一样来思考和行动,能在不需要实际做任何移动的情况下打字。

  一旦我们实现这一目标,那将是非常疯狂的,在这条路上有一整段旅程要走。

  从长远来看,拥有单独的虚拟手,让你不用实际移动就能安静地打字,这可能还很遥远。能够让人们通过耳机进行一两比特的控制——这也可能是相当强大的。这就是我们考虑的方向。

  这是一个长期的研究项目。当然,这可能会是我们如何提供输入并控制 AR/VR 设备的重要部分。

  09.

  是否通过开发操作系统、芯片

  减少对苹果和谷歌的依赖?

  扎克伯格:

  没错,我们正从头开始专注于构建一个本地操作系统,并做定制化芯片工作。这些东西需要如此紧密地优化。

  就像我们之前说的,如果你想把所有功能都用在一副看起来一幅普通眼镜上,那是很难的。你不能只是对电脑或移动操作系统进行改造,来为输入和输出构建全新的流程。

  传统上,操作系统由输入的方式来定义。对手机来说,它是触摸;对电脑来说,它是鼠标。那么他们是怎么输出的呢?图形堆栈将会完全不同。

  想一想,在 AR 中,你并没有绘制屏幕上所有的像素,只是在不同平面上渲染某些虚拟对象。在 VR 中,为了达到想要的分辨率,需要做一种完全不同的显示器,着重于凹形渲染(foveated rendering)。

  人眼的工作原理是,在集中注意力时,获得的分辨率要比分散注意力时高得多。那么,我们是否要渲染 VR 中每一帧的每一个像素,还是要为此设计一个新系统?芯片和操作系统中有很多东西……你将不得不做这种低级别的工作。

  显然有一个方面,能确保我们设计这些系统,以便构建我们想要的软件体验。我当然已经发现它对手机有一定局限性。

  有些应用商店的规则非常严格。当然,我认为可以创造出更好的社交体验的有些事情,却不被允许去构建。桌面浏览器上的整个游戏平台,基本上不被允许把它带到手机上。

  我们希望确保可以设计出下一个系统,能创造出我们想拥有的那种社交体验。那是进阶的事情。首要的东西只是让它起作用。

  为做到这一点,我认为确实需要紧密优化系统,使其适应社会可以接受的形式因素,这也是 AR 比 VR 更大的问题。

  10.

  将如何通过卖硬件来赚钱?

  问:如何通过卖这些硬件来赚钱?是否像现有模型一样全部关乎数据?从软件交易中抽成 Oculus 当前收入分成计划的常态,之后是不是延续?

  扎克伯格:

  考虑我们这方面商业利益的最佳方式,可能更类似于谷歌对安卓的看法,他们想创造自己想要的体验。在这一点上,谷歌可能会从安卓上赚到一些钱。但能够确保移动生态系统以他们认为好的方式发展,最终是非常重要的。

  对我来说,之所以做 AR/VR,是因为希望有一天人们能够四处移动。

  将来,我想这种谈话不应该通过电话或 Zoom 进行,应该是你们传送到我的沙发上,或者我传送到你们那里,坐在那里。

  我想拥有它,这样人们就能随时随地访问世界上所有东西的完整备份目录,就像 Spotify 让你访问所有的音乐备份目录一样。

  如果你能打个响指说:“好吧,我想现在就把这款游戏摆在我们面前,或者这个我想给你们展示个东西,我想调出一张地图,我不想在小屏幕上给你们看,让我们举起一个地球仪,把它做成我们想要的大小。”这些经历将会非常棒,这就是我想要建立的。

  商业模式可能将主要围绕这些体验,构建我们已经构建的应用,并扩展它,构建更多的东西。如果 App store 最终变得有意义,那就太好了。但我认为,我们的意愿可能是以尽可能低的成本提供这些产品,以便让每个人都能买到。

  与该领域以收取溢价作为商业模式的公司不同,我们的核心原则之一是希望为所有人服务。我不仅非常关注如何创造好的 VR 和 AR 设备,而且非常关注如何将它的价格压至 300 美元,而不是 1000 美元。这对让更多的人能使用它非常重要。

  我非常愿意利用 App store 等平台的优势,降低价格,让用户更容易上手。我最关心的是,我们能否提供这些社交体验?

  如果可以的话,我想目前我们在互联网上看到的就是,你可以建立一个非常好的业务。从我们的角度来看,这已经足够了,我们正努力将这项技术推向世界。

  11.

  10 年后,公司业务和收入线

  可能会有很大不同?

  扎克伯格:

  是的,这当然是希望。五年后,我们肯定还会有手机。我们有了手机后并没有丢掉电脑,可能只是把一些时间转移到了手机上。

  我的猜测是我们也会有手机一阵子,我们所做的那部分工作永远是重要的,随着时间推移,它将成为越来越多人的主要平台,由此产生许多很棒的东西。

  如果你能提供一个从根本上来说更人性化的计算平台,创造人与人之间的自然互动,那么这就是我们长期追求的梦想。

  如果我们能做建立这一基础——我确实认为在十年内,今天谈论的很多东西都能在一定程度上实现——那将是非常令人兴奋的。这些东西很多将从 21 世纪 20 年代开始出现,可能要到 2030 年或 2030 年代才能真正达到全面规模。

  但当你用着现在的系统通过电话、计算机或视频聊天进行通讯时,很难想象这些。

  我们之前谈过对一些气候变化的重要性。人们想在未来少旅行一些,提高旅行效率,不需要花费太多时间去旅行或上下班。

  远程工作是个持续发展的趋势,我认为这是个非常大的经济和社会问题。现在很多人觉得他们需要搬到城市才能获得好的经济机会和工作,很多城市在管理方面做得不好,生活费用已经失控。

  未来,如果你有这样的动力,你可以住在任何你想住的地方,基本上可以瞬间移动到任何其他地方工作,我认为这将是意义深远的。

  12.

  结语:未来十年,AR/VR 设备将成

  取代智能手机的新终端

  根据此前分析师预告,苹果的混合现实(MR)头显设备有望在明年推出。从这次采访来看,虽然没有明确点名苹果,但扎克伯格在交流过程中充分体现了对苹果的在意。

  扎克伯格此番言论,代表了 VR/AR 行业领导者对产业未来发展的期待,越来越多的人正将这一技术领域视为继智能手机之后的下一个计算趋势。

  当前,包括苹果、Facebook、微软、谷歌在内的许多公司都争相加入 AR/VR 战争,试图率先拿下这个被视作下一代智能终端的高地。通过扎克伯格的这段专访,我们能穿越到十年后看人类生活如何被 VR、AR 技术改变,也能回归技术本身,了解 VR、AR 当下最紧迫的问题和发展节奏。

  未来十年,随着 AR/VR 技术融入可穿戴设备,有望诞生颠覆智能手机统治性的新终端。

相关推荐
阅读 +