时间:2017-09-29 来源:互联网 浏览量:
如果你被问到当今科技行业最具价值的资产是什么,你可能会回答谷歌的搜索指数、Facebook的社交图谱,或是亚马逊的供应链系统。我相信,15年后,还有一种资产和这些资产一样有价值,但现在我们并不知道。比如微软的Windows,这个上世纪90年代最具价值的科技资产,在20年后的今天,却完全不同。
虽然就像1997年,我们很难想象微软会失去它的位置一样,今天我们很难想象谷歌或Facebook会失去它们的位置。但没有什么是可以保证的。
但是AR时代的到来,是大概率可以保证的。ARKit与ARCore似乎预示着下一代最珍贵的资产,但它们目前依然有所缺失,可能会成为发展路上的绊脚石。本文希望就这个问题,聊一聊那些ARKit和ARCore缺失的内容,以及这些缺失的部分将如何工作。
AR云是什么?
为了超越ARKit和ARCore,我们不得不考虑下述更细节、长远的问题:
l 其他类型的AR设备上的人,如何加入我们并与我们进行AR沟通?
l AR应用是如何在比客厅更大的区域工作呢?
l AR应用是如何理解并与世界互动的?
l 我们怎样才能把重要内容留给别人去寻找和使用呢?
为了实现这些功能,我们需要基于云端的AR软件基础架构。我一直听到人们(包括我的SV合作伙伴Ori Inbar)把它称为“AR云”,我喜欢这个名字。AR云可以被认为是一个机器可读的真实世界的1:1比例模型。我们的AR设备是这个平行虚拟世界的实时界面,它完美地覆盖了现实世界。
为什么一些媒体认为ARKit和ARCore没什么意义?
当ARKit在今年的WWDC大会上被宣布时,苹果首席执行官蒂姆•库克对增强现实大加赞扬,他对分析师们说:“这是我们将回顾的重大事件之一,并惊叹于它的开始。”几个月过去了,开发者们对下一个重大事件进行了认真的研究,但在iPhone发布会上,ARKit却没有被提及太多。这是为什么呢?这是因为ARKit&ARCore目前仅仅是1.0版本。他们只给开发者提供了三个非常简单的AR工具:
l 手机的六自由度位置和坐标数据
l 局部小型的平面
l 简单的场景照明
当我们看到最难的技术问题被解决(VIO系统的六自由度位姿)、以及蒂姆•库克在舞台上说出“增强”和“现实”这两个词的时候,我们感到很兴奋。但我们忽略了,仅仅使用这3个工具,你真的无法创造出令人印象深刻的东西。他们最大的问题在于:在开发完整的工具之前就期待着令人惊叹的应用。
要制作一款优秀的AR应用,还缺什么呢?
从最简单的层面来讲,原生AR 应用是可以实现数字信息和物理空间(或物理的人)交互的。如果没有数字/物理交互,这就只是常规的应用。更深一步讲,智能手机应用是默认的UX,而 AR 应用应该实现只能在AR中实现的内容。
Clay Bavor把AR生态系统的缺失部分称为连接组织,我认为这是一个很好的比喻。在我关于AR产品设计的文章中,我强调了任何AR应用存在的唯一原因(与普通的智能手机应用程序相比)是它与现实世界有某种互动或联系。对于一个真正连接到世界的AR应用来说,有三件事是必须要做的。没有这种联系,它就永远不可能是真正的 AR 原生应用。这些能力只有在ARCloud的支持下才能实现:
人们如何通过AR互联?
苹果在主题演讲中演示的“机器”游戏使用了一个简单的内部开发的多玩家系统。虽然看起来很好,但没有不是AR云的支持。早期报道称,该公司只有2名玩家,而且很难加入。
我们如何支持多用户分享体验?当我们身处同一个地方(或不同地方)时,如何实时看到同样的虚拟事物,无论我们穿着或佩戴着什么设备。你可以选择一个熟悉的术语来描述这种能力,这是基于你已经知道的,比如游戏玩家的“多玩家”应用,或者“社交”应用或“通讯”应用。它的基础架构都是相同的,而且都是基于相同的启动技术。真正强大的本地化,6自由度姿态和系统状态,3D网状拼接和众包网更新都是需要解决的技术问题。不要忘记应用程序级别的挑战,比如访问权限、身份验证等(尽管它们现在主要是工程问题)。
2. AR应用是如何连接到这个世界的,并知道它们的真实位置?
没有了ARCloud,这类事情是不可能实现的。
GPS并不是一个很好的解决方案,即使是即将到来的精度仅仅1英尺的GPS技术。我们如何让AR在大范围的室外工作?我们如何在绝对坐标(经纬度)和相对于现有结构的相对坐标下,实现亚像素精度的定位?我们如何在室内和室外做到这一点?我们如何确保内容停留在原地,甚至是几天或几年后?我们如何管理这么多的数据?对绝对坐标进行本地化是解决这个问题的真正要紧的技术问题。
3. AR应用是如何理解和连接现实世界中的事物的呢?
手机可以感知你走过的位置,而捕捉和管理3D数据结构则需要ARCloud。
我们的应用如何理解世界的3D结构或几何图形呢?例如,这是一个巨大的立方体状结构,我的口袋妖怪可以藏在后面或跳进去,然后识别出这些东西到底是什么;再比如,这个斑点实际上是一个沙发,我的虚拟猫咪应该远离它。实时的设备高密度3D重建,实时3D场景分割,3D物体分类(不用担心,我将解释这一主题中所有这些术语的含义),用云计算的模型回填本地处理是一个挑战。
就像在AR领域一样,打造一款不错的Demo并不难,但在现实世界中,要打造出一款在真实世界运行良好的产品是非常困难的。在接下来的几个月里,你可能会听到关于ARCloud的消息:如果你感到困惑,不是你的原因,而是他们。就在你以为你在关注AR、VR和MR的不同之处时,一切都变得更加深奥了!供应商使用相同的术语,却表达了完全不同的东西,比如:
l “多人AR游戏”可以指一种纯粹的游戏级别的方式,用来追踪玩家在游戏中所做的事情,而不需要计算机视觉或空间意识;或者它表示用来解决一些非常困难的计算机视觉定位问题的方法;或者两者都有。抑或,它们可能意味着完全不同的东西。
l “户外AR”可能指的是一款ARKit应用,具有好看而丰富的内容;也可能意味着全球化自动驾驶汽车的3D地图系统。
l “识别”可能意味着手动配置你的应用可以识别的单个标志点/图像;或者它可能意味着一个实时的通用机器学习驱动的,全球3D对象分类引擎……
今天的AR云服务是否能胜任这项工作?
当我在电信基础设施领域工作时,有一种类似禅宗的真理,说“没有云,只是别人的电脑”。
我们最后总是使用连接一台电脑和另一台电脑的铜对或光纤束(或无线电频谱),哪怕是在世界各地。这不是魔法,只是很难。我们的云计算基础设施与当前赋能网页和移动应用的云计算无法适配,是因为AR(就像自动驾驶汽车和无人机和机器人)是一个实时系统。任何曾在电信行业工作过的人都能够深刻理解:实时基础设施和异步基础设施是两个完全不同的东西。
因此,尽管AR云的许多部分将涉及托管大数据、提供web APIs和训练机器学习模型,但就像今天的云计算一样,我们需要对如何大规模地支持实时应用和AR交互进行深刻的反思。
基本的AR用例有:
l 使用“AR Skype”,通过流媒体直播房间实时3D模型,更新与事物相关的数据和应用程序。
l 根据我的视线来展现“我在看什么“与”谁走向我“这样的流媒体(丰富的图形)数据,或者谁走近我。
l 在音乐会上,维护并更新每个人和应用程序的实时状态。
如果无法做到上述类型的用户体验,AR就没有真正的意义。我们还是继续使用智能手机应用吧。但是,为数十亿人提供上述支持将是一个巨大的商业机会。5G网络将会发挥很大的作用,而且是专门为这些用例设计的。可是,我们过去所搭建的基础设施,并不是为了支持大规模并行、数据密集型、实时的应用程序而构建的。
ARKit(或ARCore)没有了AR云就没用了吗?
最终由AR应用的用户来决定这一点。没用的词是一个挑衅的词。到目前为止,在一个月的时间里,根据早期的数据,用户倾向于“几乎毫无用处”。我个人认为,有用的应用可以在今天的ARKit中建立起来,但它们只会对某些人有用,偶尔也会有用。它们可能是一种有趣的新奇事物,当你分享它时,它会让你微笑。如果你买了沙发,你可以提前试一试。但这些并不是为日常应用的刚需而生的新平台。
所以,我们需要原生应用,那些真正连接到现实世界的应用。为了将我们的应用程序连接到彼此和世界,我们需要相应的基础设施来做到这一点。我们需要AR云。
本文原文链接:
编译者信息:
亮风台(上海)信息科技有限公司,产品HiAR SDK主打功能为云识别,目前支持本地识别、云识别、以及本地和云混合识别。前不久,亮风台公布B轮融资,消息提到“云+端”是重要战略,可以预见,下一步,HiAR SDK的云能力也会再次提升。