转载 | 揭秘Rokid Glasses光学:一拖二波导是AR+AI产品最优解之一?

 

 

本文转载自公众号 “ 光学显示观察 ”  作者:HRTina

 

         在前一阵的某个会议上,本人做了一个主题为《XR光学架构:现在与未来展望》的Talk。内容比较庞杂,其中衍射波导的Section中,我介绍了一些现存波导设计的发展与优劣,并且单页分析了所谓的“一拖二”式波导的好处,称其为“当前产品化落地可行性最高的波导设计Layout之一”。

         因种种原因,部分细节略作必要处理👀

 

         这个设计由光舟半导体的Tapani Levola(原诺基亚/微软,衍射波导架构的发明人和奠基人之一)与其CTO Alex Jiang博士发明。之前已经用在李未可的骑行眼镜以及其他公司的产品中(比如最近发布的微光玄景M5),还用于前一阵热度很高的Rokid新一代眼镜Rokid Glasses。
         今天这篇文章就来阐述一下,为什么我说它是“当前产品化落地性最强的波导Layout”。(注:本文大部分基于笔者自身的观察、公开资料及相关光学知识推测,与实际产品中光栅的设计或有一定出入)

Lhasa Layout:单光机输入,双目输出

         所谓“一拖二”(下面简称其产品命名“Lhasa”)波导,顾名思义,便是只采用一个光机,由特殊设计的光栅结构将其光机输入的光一分为二,最终实现双目显示。如下图实物图:

 
 

         从下方仿真图可以看到,在Lhasa中,光机的光被耦入光栅一分为二,经过左右两个扩展光栅后,分别再进入对应的耦出光栅,进入人的左右眼。两边各自的光栅实际上可以等效于HoloLens 1经典的H式三段式布局。

 

         

         之前多次讲过HoloLens 2的Butterfly Layout。如果把Butterfly和光舟的这个Lhasa放在一起的话,会发现二者实际上异曲同工。

         不同的是,HoloLens 2主要是用这种双通道式的EPE去分解FOV,最终在单眼处用双面光栅实现结合及耦出;而Lhasa是把整个FOV用两个通道分到左右眼,用一个光机+一个波导实现了双目显示。

         综合看,这有以下几点好处:

 

         ★ 省掉一个光机,大幅降低成本&功耗
         这个好处是最直观、最显而易见的,就类似本人发明的一拖二几何光学(“空分光导(BM)”)架构,(见【新品】61°FOV单屏双目,屈光度可调AR显示方案发布)。对于波导来说,去掉一个光机可以把成本节省很多,因为DLP、microLED的价格均不菲。

 

图:网上随便找的

 

         在《解密Meta新一代AR眼镜光学:不卖1000美金可能就亏了?|漫谈》中,我曾提到,为了降低成本和双目融合的麻烦,很多公司做的妥协是采用单目显示,即单光机+单目波导(如上图),但人眼看时间长了可能不会舒服。

         Lhasa和BM类的方案正好解决了这个问题,用单光机/单屏就实现了双目显示。

另一个重要的好处是,少了一个光机,功耗也大幅降低。这对部分业内鼓吹的所谓“全天候AR”是非常重要的,毕竟用一个小时就没电了,怎么也不可能“全天候”。

 

         ★ 能量利用率更高、更巧妙
         一般来说,光机的光被SRG里的耦入光栅衍射后(假设是透射式光栅),会形成三股主要的光:朝着正下方去的0级光(一般被浪费)、在波导里以全反射行进的+1级次光和与+1级次光对称的-1级次光。如果不用倾斜光栅等形貌,一般+1和-1级次的能量是一致的。

    普通单层单目波导

 

         如上图,为了充分利用能量并且不产生其他杂光,普通的单目单层波导一般需要将周期加以限制,以便使衍射光没有+1和-1级以上的级次,但也往往仅能利用一个级次的光(即+1级次),而另一个级次(-1级次)的光往往被浪费。(因此一些超表面AR方案利用+4、5、6级次光,解决宽光谱下的杂光问题大概会是个巨大挑战)

Lhasa波导

 

         Lhasa和HoloLens 2的波导恰好巧妙地解决这个问题,把本来被浪费的-1级次的光给充分利用了。对Lhasa而言,相当于原来-1级次的光朝着左侧的光栅区进行全反射,最终被另一只眼接收。

 

         ★ 解放镜腿空间,对结构设计更友好,ID更有想象空间
         镜腿处空间不需要放光机,这对镜腿、转轴等设计都会产生极大的便利和友好,重量当然也会降低一些。
         如下图,和左右双目都有光机并且都内藏左右摄像头的眼镜比起来,镜腿折角部分明显小非常多(下图右方为采用Lhasa的产品)。这样就很难会出现光机部分卡住用户太阳穴的问题。

 

         此外,镜腿不需要放光机的话,眼镜腿转轴的部分也会得到相当程度的解放。以前转轴基本只能放在光机后面,这极大限制了外观ID和人因设计(除了DigiLens尝试过把光机和波导分离,也就是转轴放光机前面,但是那样的良率和可靠性完全不可保证),如下图:

 

         

         采用Lhasa结构波导的产品转轴可以放在更前面,如下图。更有甚者,可以直接把镜腿去掉。

         

         比如,最近的微光科技推出的“夹片式AR阅读器”玄景M5,把整个模块(光机+波导+电子)直接做成了一个可以夹在普通人眼镜上的挂件(下图),实现了即插即用的模块化,也省去了用户另配近视夹片的烦恼,较为轻巧方便。而常规的双光机双波导架构几乎不可能做到这种结构设计。

 

 

        ★ 大幅降低双目融合复杂度
         传统的双目波导+双光机的架构,双目融合是个极大的问题,因为这需要两个光机+两个波导,总计四个光学件去做非常精细的匹配。一般来说,需要采用成本很高的设备对这四个东西的位置进行校准。

         

         如上图,如果在这样的架构下,左右眼的任何一个元件稍微不匹配——比如两个光机/波导在x、y、z或者旋转方向不在一个平面,就可能造成左右眼画面出现水平、垂直或旋转不融合,抑或是左右眼亮度、色彩不一致,出现视疲劳等问题。

         而Lhasa这种Layout,由于整个左右波导被整合成了一个,光机也只剩下一个,相当于只需要调整波导耦入光栅和光机的对准位置。耦出的对准只和两个耦出光栅压印出来的位置有关(这很难出问题),对双目融合的需求大幅降低。无形中大大提高了良率,也降低了成本。
Lhasa波导的产品潜在问题?

         接下来,还有一些产品相关的议题,在这里也可以展开,发(nao)散(dong)一下:

 

         ▲ 如何实现3D显示?
         常见的质疑是,Lhasa这样子一来没办法看3D了,因为没办法靠两个光机生成稍有不同的画面来实现3D效果。
         不过实际上,Lhasa类架构仍然可以实现3D:在光舟的专利中,提到用液晶快门来实现左右眼实现不同的画面。

 

         方法也比较简洁:即用上图中80和90两个液晶开关来控制,当光机的光显示左眼那一帧的时候,就打开左眼的80液晶开关,右眼对应的90液晶开关模式搞成反射,使左眼的光无法通过,如此一来只有左眼能看到画面,下一帧则显示右眼的与左眼稍有不同的画面,此时将80、90的状态调转,以便只让右眼看到画面,如此反复。

         这实际上是打了个时间差,因为每帧只有左或右一只眼睛的画面显示,但是连续快速切换的时候,人眼不太能感觉出来。

 

 

         虽然这种架构肯定是以牺牲刷新率为代价的,因为显示屏的帧率需要折半。这就需要用较高刷新率的屏幕,比如90-120 Hz,这样折半也是45-60。另一个问题是,液晶的响应速度可能跟不上屏幕,如果刷新率太快,会导致液晶跟不上显示帧的变化,导致本来左眼的画面“残留”到了右眼去。
         当然另一个问题是,这样肯定会牺牲不少光效:因为本来可以进另一只眼睛的光相当于被浪费掉了(所以外面可能要加一个透光度不高的墨镜片,类似ML2的把戏);液晶的工作稳定性也是个问题,实际看到的3D效果可能不会那么完美,如前述,有可能因为液晶的响应和画面的切换不匹配而“露馅”。
          但是,一个关键的前提不能忽略:对于现在的AR眼镜,3D功能真的很重要吗?
         某些人说没有3D显示就不存在AR眼镜,我认为这是彻头彻尾的扯淡——看看上万条当前BB眼镜的评价就会明白,目前大部分的几何光学类眼镜(如BB/BM/BP)仍然是被用户当作随身大屏(即显示器的替代品)来用,看的仍然是电脑、手机或平板投来的2D的画面。3D的视频和游戏内容都较少,经常使用的人就更少,为它们掏钱买产品的人更是少之又少。
         众所周知,波导因其显示效果和FOV限制,短期内很难取代以BB/BM/BP为主的随身大屏场景,主要以文字或提示类信息为主。如果是主打这个场景的话,则3D根本不是它的主要功能。

 

         ▲ 能否实现合像?

         测试下来,光舟应该是在Lhasa波导的光栅上做了一些功夫,实现了双目合像距离,即波导的入眼光不再是两个垂直的平行光,而是会形成双目合像的夹角,这对双目融合至关重要,因为很多人看有些波导的画面很难合像,是因为两个无穷远的平行光有可能找不到合像的辐辏角。

          所谓的辐辏角简单理解即人类双眼视轴的夹角α,而当人两眼盯在一个点处,称为汇聚(convergence),合像距为D。如图:

 

 

         我用手上的李未可眼镜实测双目合像距,这个距离最终结果为9.6米——在光舟宣称的8米合像距离的基础上有所浮动。而其辐辏角绝对值为22.904’,也就是差不多0.4度,还算符合需求区间。
         一般来说,传统的双光机双目可以靠光机和波导形成夹角来实现这个合像角,但是整个双目波导做成一体式的Lhasa如何实现辐辏角呢?

         个人有两种推测:其一是光舟在光波导上采用了一些独特的设计,比如调整耦出光栅的周期,使得其出射的角度发生一定变化。

 

 

         但是这样一来,耦入和耦出的光线角度就会不一样了,相当于所谓的K矢量不闭合,造成色散,降低MTF。当然,李未可是单色显示,只有绿色的色散可能不会影响太多MTF。

 

 

         其二是光机的分光棱镜将光以两个不同的角度打入耦入光栅,即在入射时就形成不同的角度。耦入光栅的左右不同区域可能也针对不同入射角做针对性设计,但是这样一来整个系统就比较复杂了(可能还需要防左右眼的crosstalk)。

         当然,这仅为通过调整波导的出射角度来实现双目的一个合像辐辏角。并不是Magic Leap声称那样的通过周期变化来实现真正的虚像距屈光度。

 

 

         来自Bernard Kress博士《AR/VR/MR光学架构》

 

         如上图,众所周知Magic Leap声称采用了双焦面架构的波导来实现两个距离的虚像显示,以解决VAC问题(即所谓辐辏调节冲突,可以粗略理解成虚像距离和视轴汇聚点在视觉神经里距离不统一导致的晕眩感)。
从一些信息看来,Magic Leap有可能采用了周期变化的光栅,即将透镜的相位结构与光栅相结合,实现带屈光度的光栅。如下图Vuzix专利图中显示的。

         之前看过光舟在对外的演讲中简单介绍过类似方向的研究,不知道是否已有样品。如果能用到Lhasa上,对于一拖二波导实现多焦面、解决VAC肯定是个有潜力的方向。

 

 

         ▲ 清晰度会不会降低?

         有一种常见的误解是,双通道架构在把光分成两个方向的同时,也“减半”了分辨率,实际上这是彻头彻尾的误解。因为决定分辨率的是光机,也就是显示屏本身的像素,而光栅的+1和-1衍射级次的光理论上是完全一样的。
AR里用的表面浮雕光栅(SRG)本质上是一个相位结构,所做的功能是把光转向——想象一个电视画面,你用几个镜子去把电视画面一分为二,每个镜子看到的画面清晰度和原来比是不会有任何变化的(当然,由于生产和材料的缺陷性,可能会降低一部分MTF),看HoloLens 2或者类似双通道的波导设计便可明白。

 

         ▲ 如何做双目镜片有夹角的ID造型?

         在日常我们佩戴的眼镜中,为了美观和对人眼友好,两个镜片的夹角往往并不是平直的180度。而在前期的一些AR眼镜中,由于认知限制或者结构的考量,往往把这个夹角搞成了平直的,导致整个产品看着很呆板、蠢笨,比如:

 

 

         那么问题来了,如果是Lhasa的波导形态,中间是靠玻璃连接,如何实现更好的造型?

         实际上,这个问题也可以解决,比如光舟的专利中提到的方法:

 

 

        可以用单棱镜或者双棱镜分别分光,把光分成两股进入较为紧密排列的对应左右眼的耦入光栅(当然,这样一来原本能较充分利用+1/-1级次的优势也会大打折扣了)。

 

 

 

         ▲ 可以实现更轻的树脂材质

          在30度FOV和单色显示下,对波导基底的折射率要求不高(1.5的折射率、只有绿色的话可以支持大概4:3画面的36度的FOV),因此用更轻的树脂材料做是可行的。

 

         ▲ 可扩展至更多光栅类型
         由于只是把耦入复用,Lhasa这一架构同样可以换成WaveOptics式的二维光栅。

         当然这样一来,镜片的面积可以得到缩减,耦入光栅的位置要相对靠下,以便与二维光栅的位置匹配,比如:

 

         

         发散一下,也可以采用V式的三段式布局,但如此一来,耦入的部分需要针对两个扩展光栅的角度做专门设计,实现光线偏转,而且这样一来无法实现巧妙利用+1和-1级次的优势了,光效不会高。故而得不偿失,没有必要。

 

 

 

         ▲ Lhasa潜在的短板

         Lhasa的短板,除了3D需要特殊处理实现外,个人能想到的主要问题就是镜片比起常规的单目波导稍大,可能对于晶圆的利用率不是很好,导致晶圆上切不出来太多的波导,从而间接提高成本。

         但是说句实话传统单目波导如果要实现双目显示(即使用左右两个波导),占用的面积也不会比Lhasa小太多。

 

 

         第二个问题大概就是中间连接处略细,容易断裂,可靠性或许存在问题。
         另一个问题就是双目光栅都需要压印或刻蚀得比较好,不然一边光栅如果加工不好,整片可能就没法用了。

 

         ● 总结

         最后总结一下,Lhasa波导大概有几个关键优点:
         ✅ 省掉一个光机,大幅降低成本&功耗;
         ✅ 能量利用率更高、更巧妙;
         ✅ 解放镜腿空间,对结构设计更友好,ID更有想象空间
         ✅ 大幅降低双目融合复杂度;
         ▶️ 经过特殊处理,可以实现3D;
         ▶️ 经过特殊设计光栅,可以实现双目合像角;

         正是以上这些原因让我认为,它是当下“产品化落地可行性最高的波导设计Layout之一”。

 

       

          在《XR光学架构:现在与未来展望》的PPT中,我提到接下来在产品应用端,AR和AI的互相促进关系——AR可以使得本来停留在文字和语音的AI“具身化”,而AI可以使得原来场景很尴尬笨拙的AR变得更加“智能化”。这对几何光学和波导光学都存在同样的利好机会。

         Lhasa方案FOV 30-40度、可支持单色和全彩,在当下的场景足够用了。可以成为使AR+AI波导产品普及的一个较便捷的方案。降低了整机物料和组装项目成本,或许让更多中小创业者有机会参与这个趋势,也让消费者更能买得起AR+AI产品。

 

         再次体现SRG核心优势:高可延展性,设计上限大
         在《XR光学架构:现在与未来展望》的PPT和上次讨论Lumus的文章(解密Meta新一代AR眼镜光学:不卖1000美金可能就亏了?|漫谈)中,我曾经提出SRG的核心优势(尤其相比较于几何光波导)就是高可延展性,设计上限大。
         Lhasa再次印证了这个观点,同样的架构,几何波导几乎是不可能实现的(即便实现,良率大概也会非常堪忧)。
         当然,我每次都会强调,这并不是说几何波导没有价值,实际上,在作为AR眼镜的显示器件方面,几何/衍射光波导本质相同(都是扩 大Eyebox同时把光学Combiner变薄的工具)、各有优缺点。在波导这个范畴里,当下并没有特别完美的方案。

         SRG在颜色/亮度均匀性、光效、FOV等方面与几何光学相比存在差距、并且短时间很难实现根本性解决的情况下,利用自身的设计自由度高的优势特色,来实现类似Lhasa这样独特的、能够匹配不同场景的更好的Layout,或许是SRG当下从产品端打开局面的最好思路之一。

 

 

新闻动态

洞悉专业趋势,为您的品牌创造价值

首页    转载 | 揭秘Rokid Glasses光学:一拖二波导是AR+AI产品最优解之一?