主打语音和人脸识别,Rokid Glass 2正式发布

“在脑内植入芯片成熟前,AR眼镜将是交互的终极形态”,Rokid创始人兼CEO祝铭明在今天的Rokid开放日上讲到。

今天Rokid发布了最新一代Rokid Glass 2,这是一款面向行业的AR眼镜产品,其采用分体式设计,眼镜重90g,支持折叠,单目阵列光波导模组,应用侧的重点放在了人脸识别和语音识别,这也是本次活动上最值得关注的地方

 

做专注交互的公司

祝铭明讲到:Rokid成立之初就专注在交互上,最初Rokid的AR眼镜注重在视觉上,而智能音箱专注在语音上,本次发布的Rokid Glass 2就是一款在视觉和语音上的结合型产品。当然,我们也可以看作是Rokid成立5年的代表作。

目前巨头都在聚焦AR领域,消费级市场有极大潜力。祝铭明表示:“整个AR眼镜生态形成大约需要5年时间(从今年开始算),而初步的应用需求起量大概需要2年时间。”

而在市场应用之前,Rokid要做什么呢,答案是:把技术找到行业落地的应用案例。

大家都知道,国内外有很多AR眼镜垂直行业解决方案应用商,那为什么是Rokid呢?Rokid有什么优势呢?接下来我们一起来看。

Rokid创始人兼CEO 祝铭明

快速迭代优化,二代Q2出货

Rokid Glass系列定位就是一款面向行业应用的AR眼镜,初代产品采用一体式设计(内置骁龙835 Soc),单目自由曲面光学发方案,眼镜重150g。

根据Rokid消息,初代Rokid Glass于2018年6月发布,并于11月宣布落地的安防应用案例;于2019年5月宣布量产。

祝铭明向青亭网表示:初代Rokid Glass出货量可观,数量达到K级。

今天发布的Rokid Glass 2则采用分体式方案,镜腿支持折叠,光学方案更换为单目光波导模组,由于分体式设计也让眼镜更轻便,仅90g,而分体式另一端则拥有10000mAh电池,宣称续航可达8小时以上(功耗约2.6W),处理器(集成在电源模块)则更换为Amlogic 905D3(内置NPU)。

很显然,Rokid Glass 2在更新迭代上做了一些取舍,例如光学方面升级为显示效果更佳的光波导,在CPU、RAM、ROM、摄像头等方面都有所调整。当然,这也是了解到AR行业应用真实需求和反馈后的调整。

据了解,Rokid Glass 2预计Q2开始出货,已向行业客户提供报价等。

接下来说一下硬件部分值得关注的几点:

1,单目光波导

据了解,Rokid Glass 2采用了和理湃光晶合作的阵列光波导模组,其宣称是目前市面上最小的40度FOV的光波导模组(Rokid独家采用),这点上基本没有质疑,光机变小更利于产品轻量化。

光机部分设计

光机采用了LCoS方案,分辨率1280X720,对比度400:1。光波导模组优势在于透光度更好,而自由曲面配备OLED画面和对比度表现要更佳。

 

前端护目镜为磁吸式设计,配有800万像素RGB相机和光线感应器

 

中间可加磁吸式近视镜片

实际体验来看,视场角确实还不错,条纹感略微显现,还有提升优化空间,基本上不会影响观感,包括文字阅读。

2,可折叠镜腿

 

Rokid Glass 2采用了可折叠镜腿设计,这点要得益于独特设计的排线。

Rokid表示,转轴上穿插了20根同轴线缆,并宣称完成了2万次连续弯折测试,这也是Rokid Glass 2的亮点之一。

另外,可折叠好处不仅在于可内向90度折叠,还可以实现外侧扩充15度,这样的好处是支持脸廓/头围更大的用户,比固定镜腿应用更为灵活。

3,更细更软的连接线

Rokid表示,由于二代眼镜为分体式设计,眼镜左侧镜腿后需要连接USB Type C电缆到计算模块使用,而连接线则采用定制化处理。

虽然数据规格方面就是常规USB 3.0,但它更柔软,且直径只有3mm。

 

另外,镜腿左侧拥有一枚扬声器(非立体声),右侧镜腿外侧拥有滑动触控区,顶部有两个物理按键。

计算模块&电源模块,拥有USB Type C和Micro USB接口(工程机,忽略外观磨损)

关于眼镜整体佩戴感受,首先90g的重量是直接承托在鼻子与耳朵上,我佩戴感受是耳朵部分压力较大,也可能是我佩戴局促导致;发热控制还算理想,这是在体验区样机一直工作的前提下。

 

主打语音和人脸识别应用

关于功能层面,Rokid Glass 2加入双向语音能力,全程支持语音唤醒(无需唤醒词),号称响应速度0.5s。同时,Rokid Glass 2内置NPU芯片,基于图像识别算法可实现本地0.6s快速人脸识别,识别率宣称达98%,同时还有一套远程指导方案。

说实话,看过这部分演示后才算看到这款产品真正的价值。

而这正是Rokid算法上祝铭明讲到:“Rokid自身定义是一家软件公司,但目前不得不靠自研硬件来体现出软件和算法上的优势,市场还需要给我们一些时间来证明这一点。”

据了解,目前Rokid营收一半以上是软件收入,也能证明公司的侧重点。

首先是语音识别,Rokid Glass 2采用免唤醒语音识别方案,并且在降噪处理和定向识别能力上做出优化。

关于免唤醒语音操作,我体验时系统界面下方会显示当前应用支持的语音指令,例如放大,缩小,锁定画面,回到原点等固定指令,另外全局还有一个帮助指引语音指令。

而发布会上的演示拥有一个系统主界面,可以语音操作上下左右切换等,简单来说目前系统和第一方应用可以做到语音操作全搞定。

至于第三方应用,目前Rokid已开放SDK,其共有两大SDK,一是和眼镜本身相关的语音、头控、触摸等交互SDK,二是Rokid在人脸识别、车牌识别、物体识别方面的功能SDK,并兼容Android Studio、Unity3D、Cocos等平台。

 

视觉方面,Rokid Glass基于内置NPU可以实现本地的0.6s快速识别,且最多识别10个人,准确度达98%。

另外还在和阿里云合作,提供基于云端的人脸识别,但据工作人员讲,云端识别受到网络环境等因素影响,综合识别速度可能在3-4s。

在我现场体验时,单人人脸识别效率够快,多人移动模式下,人脸识别框略有延迟。而发布演示时多人识别速度很快,猜测跟观众处于静止状态有关。综合来看,人脸识别方面表现在同类产品中较为优秀。

相信你能看出,Rokid Glass 2的应用场景就是语音和人脸识别领域。其中最主要的方向就是安防,同时也可以应用在教育,工业等场景。甚至我在想,这些技术完全可以搬到消费级应用上,这就是扎扎实实的技术积累。

小结:

诚然,从硬件角度来讲,Rokid Glass 2并不能说表现突出,但单目光波导的产品接受度是足够的,视场角大、色彩、对比度的优势是直观的,对比下它的竟品则是一众棱镜方案产品。当然产品佩戴有提升空间,暂不支与手机连接等。

软件和应用层面,Rokid Glass 2自身拥有出色的语音识别和人脸/图像识别能力,如无意外,这个优势也会随着应用范围扩大而持续扩大。

新闻中心

NEWS