Meta光学工程师道出逆耳忠言,堪称“2018年度耿直Boy”

爱德华多 18-12-30 16:12:19 0
在这场演讲中,Barmak Heshmat提出了很多看似消极的观点,诸如“不要对沉浸感到太兴奋”、“AR不会很快取代手机”。

在最近的TED演讲中,AR公司Meta光学工程师Barmak Heshmat博士发表了11分钟的演讲,讲述了他对VR/AR行业现状和未来的一些看法。

与一些VR/AR行业中吹嘘技术的人不同,在这场演讲中,Barmak Heshmat非常“耿直”地提出了很多看似消极的观点,说出诸如“不要对沉浸感到太兴奋”、“AR不会很快取代手机”这样的言论。

总的来说,Heshmat提出的观点是“忠言逆耳”,都是为了让大家看清一些VR/AR行业急需认清的问题,告诫大家不要赋予过高的期望,否则只会把整个行业拖死在虚构的未来中。

他说:“先不要想那些看似酷炫的东西,坚持真理,一起把行业建立起来”。

----------

过去几年,光学工程师和科学人员都为一些我们一直当打造的行业所苦恼着——我说的就是VR/AR头显。这些头显可以把图像放置在现实景观中,或创造完全虚幻的世界。因此,它们都有望成为改变一切的下一代新兴技术。当你戴上头显,就可以拥有钢铁侠那样的超能力,并通过AI技术告诉你该做什么,怎么做。

听起来确实挺不错的,我自己也对这个领域感到非常兴奋。这些是我所绘制的直至2023年头显的预测演进过程。

但是,让我困扰不已的是,很多不精确的甚至具有误导性的信息导致了VR/AR行业炒作潮流的产生。甚至包括我们这些工程师在内的人,都开始忽略自身的技术共识。所以,我感觉有必要今天来到这里跟大家分享一下自己的看法。我想说的东西,会跟大家平常从媒体上听到的关于VR和AR的信息截然不同。我想跟各位科普一下,让大家认清现实——因为我们真的需要知道这些东西。

首先,朋友们,这个东西只有在好莱坞打造的《星球大战》电影里面,才会叫做全息影像。实际上,这并不是全息影像。这是我要说的“不准确信息”的其中一个。

这个才是。这由干涉激光技术制成,用于记录光线表面。《星球大战》中的所谓“全息”只能说是立体显示技术,而头显能提供的只是类似于IMAX 3D的立体图像。所以,如果说这是“全息”的话,就相当于把比萨称为奶酪蛋糕。要是你点外卖说想要一个放辣椒放烧烤的奶酪蛋糕,餐馆肯定会气炸了吧。

让我觉得不爽的还有光场。关于这个技术的新闻,你应该听得越来越多了。一些企业正在努力让光场技术听起来像是一种疯狂的神经学、量子物理学东西。但事实上,它绝对不是。让我用30秒告诉作为消费者的你光场到底是什么:光场就是从显示器到达你眼睛的光线并不是来自像IMAX屏幕这样的单一平面,而是来自场景中不同物体的不同光学深度。就是这样而已——看,解释起来其实也不需要用到30秒。

各位跟我一起做以下动作:手指摆好,闭上一只眼睛。如果你盯着前面的手指,后面的手指就变得模糊;如果盯着后面的手指,前面的手指就变得模糊。把这两根手指换成数字图像或者数字物体,就是光场技术。就这么简单,不需要什么量子物理,只是最简单最经典的物理学原理。

这么说吧,第一次体验光场技术,确实会感到惊讶。就像“哎呀,3D早该这样子了”。但一旦体验多了,很快就会习以为常。未来数年,在保真度优化方面的竞争将越来越激烈,但这种竞争很快就会饱和。因为我们人类的单一眼睛实际上对深度并不敏感。

这个图显示了平均40岁时,我们眼睛可以检测到的深度变化。横轴是物体距离眼睛的距离,纵轴是眼睛的屈光度。年轻时候我们可识别24种深度,但随着年龄的增长,识别的深度数量就会疯狂下降,因为眼睛的调节度降低了。到了50岁,数量降到只有3到5种。也就是说,我们一个眼睛可以识别大约800万个平面像素,但只能识别3到5种深度。

这是一只眼睛的情况,两只眼睛就会有超过3000种深度情况,受到年龄的影响相对低一些。

另一个参数是视场,也就是你能看到多宽,多高的场景。如果你有一个视场比较大的头显,在不牺牲图像质量的情况下,沉静感会更强。但是人的双眼视场角一般为114°,头显视场如果超过这个数字,就是多余的。不过这个数字也因人而异,鼻梁比较扁的人最多可多出40°。

还有一个很重要的,但是很少听到大家讨论的东西就是AR的图像质量。各位,很抱歉地要坦白地讲,但AR图像质量很长时间内都会很烂。而且我不管你花多少钱投资这些东西,这个东西不会很快取代你的手机或者监屏幕的。

为什么呢?对于这个我写过一些基于物理学的论文。目前我们所熟知的透明AR屏幕的对比度远比不上普通屏幕,未来几年内也不会。它们的像素精准度也不如手机屏幕。而且,AR头显也无法变得像普通眼镜一样轻巧和透明,所以只会大大牺牲掉其他参数的表现。

也别跟我说什么摩尔定律,说什么设备会越来越小,然后突然有一天就大获成功。不是这样的各位,你看看微型投影机,发展了这么多年,也没有取代手机,因为对比度和分辨率实在太烂了。

我并不是在吐槽和抱怨什么。我也相信这些技术,我自己也在行业里努力着。我只想让消费者、投资者和工程师们知道并关注这些问题。

经历过这么多挑战后,我想谈一下我是怎样以务实的视角看待AR的未来的。跟很多人一样,我认为未来将出现两种类型的AR头显:第一种是电脑级眼镜,像护目镜一样,视场可达100°以上,双目分辨率8K,可在VR和AR之间切换,有望在未来5到10年内出现;第二种是手机级眼镜,更像普通眼镜,比较轻巧,虽然可能没有丰富的图像效果和较大的视场,但将成为便携式AR设备,例如手机外设。至于后者,我相信苹果、三星等手机巨头投入大量精力研发这样的产品。

这些就是10年后的AR产品。但是我们需要怎样打破炒作,解决实际问题,打造出这样的产品呢?对于不同的人,我想给不同的建议。

对于消费者和开发者,如果要买一套头显,购买前必须先试戴20分钟;

对于硬件厂商,坚持研发有效的技术,先抛开那些看似酷炫的技术,不要投入了好几年的精力和资金后才发现错过了市场测试的机会;

对于包括我在内的开发工程师,应当在行业内设立标准,以测量谁的图像技术更好,同时自我改良,例如降低渲染跟踪和定位的计算成本,或者使用机器学习等方法。

对于最重要的消费市场:

首先必须要有杀手级应用。没有这个东西,市场不会迅速发展的。这就需要我们找到只有AR可以实现的东西。例如,可以精准感知你在看什么以及身边环境的AR头显。

其次,分辨率必须比现在的高出10倍,同时降低一半的使用成本,因为说服大家把头显戴在头上已经不容易了。

听到人们把AR比作当初还很笨重的手机时,我都忍不住笑出声。这样的对比是错误的。手机是解决移动交流的,当初并没有任何的竞争设备,但AR头显必须跟手机这样的在今天已经很成熟的技术竞争。

而且,AR设备未来10年间要解决的问题是什么?在我的房间里玩沉浸式游戏?哥,你认真的吗?拜托了,请不要对沉浸感到太兴奋。当初3D电视就是这样死掉的。我不需要沉浸在电子邮件或者福克斯新闻中。我也不需要在已经拥有72英寸、高动态范围、价格是头显一半的4K游戏的房间中玩AR游戏。我只想完成工作,快速十倍,容易十倍。我只想提高记忆,提高创造力。这些东西才是真正的价值。

最后我想说的是,女士们,先生们,工程师们,亿万富翁们,我们需要认清AR的真实现状,集中精力解决实际问题。AR是一种很酷而且让人兴奋的技术,但继续炒作下去,只会打破公众的信任,拖垮整个行业。所以,先不要想那些看似酷炫的东西,坚持真理,一起把行业建立起来。

谢谢。

参考资料:TEDxYouth 编译:黑匣 爱德华多

郑重声明:黑匣网(www.heix.cn)的全部内容,均为本网合法拥有版权或有权使用的作品,受法律保护。未经本网书面许可,任何单位及个人不得转载、摘编或者以其他任何形式擅自使用,违者必究,特此声明!如需转载,请联系【黑匣微信:heixvr】

黑匣微信:heixvr黑匣微信:heixvr

评论

评论正在加载中~
~\(≧▽≦)/~