从Google Glass到Vision Pro,智能眼镜的探索之路虽屡有尝试但尚未取得广泛成功,直到Ray-Ban Meta的出现,才为这个行业重新点燃了希望。进入2024年下半年,随着AI大模型技术的不断深入应用,智能眼镜领域又焕发了新的生机。
百度与国内领先的智能眼镜品牌Rokid携手,发布了具备AI功能的智能眼镜产品。此外,小米和苹果也被传将加入智能眼镜的研发行列。同时,OPPO、vivo、华为、腾讯、字节跳动等众多科技巨头也都在积极评估AI眼镜项目,智能眼镜市场呈现出一片蓬勃发展的态势。
目前,AI眼镜的销量相较于智能手机行业的庞大规模而言,仍只是“沧海一粟”。那么,推动AI眼镜渗透率进一步提升的关键催化剂究竟是什么呢?
AI眼镜目前仍较“鸡肋”
近一年来,Meta Rayban眼镜销量破百万的消息让众多公司兴奋不已,“AI眼镜”这一被寄予厚望的新品类再次成为热议焦点。在美国的街头巷尾,不时可见有人佩戴着这款配备双摄像头和音频功能的眼镜,彰显着科技与时尚的融合。
所谓的“AI眼镜”,硬件上其实就是带了音频和摄像头功能的眼镜。这一理念并非新鲜事物,早年间Bose的BoseAR眼镜就实现了音频功能,相当于一个墨镜形态的耳机;Snap也推出了第一代带摄像头的Spectacle眼镜,让用户能够轻松拍摄短视频。然而,为什么“AI眼镜”突然又火了呢?
原因很简单,因为大模型的出现。
现在,大家主打的概念是用手机上的大模型(通常是一个APP,如字节的豆包)来“赋能”眼镜,使其不仅仅是一个简单的佩戴设备,而是成为了真正的AI智能硬件。
然而,笔者认为,目前的所谓“AI眼镜”必然会在短时期内全面过渡到AR眼镜,即从“音频+摄像头”过渡到“音频+摄像头+近眼显示”。因为,在实际使用中,当你被迫掏出手机的那一瞬间,“AI眼镜”就失去了其作为独立智能设备的存在意义。
对于一个产品来说,场景至关重要。以百度的小度AI眼镜为例,它据称具备第一视角拍摄、边走边问、卡路里识别、识物百科、视听翻译、智能备忘等功能。这些功能听起来很吸引人,但仔细分析,其实都可以在手机上实现。AI眼镜无非就是把手机上的音频和摄像头“搬”到了头上,方便某些特定场景(如双手被占用时的导航、拍摄等)的使用。然而,这并不能完全体现AI眼镜的独特优势。
在实际使用中,使用者与AI的交互大多还是在手机上进行。当你需要了解某样东西时,你会问AI,AI会给你发一大段文字。但在AI眼镜上,这种交互方式就显得有些笨拙了。想象一下,你戴着AI眼镜走在路上,问一些问题,AI的回答你可能根本记不住,也没耐心听它说完。因为大脑理解文字或图片信息的效率远远大于声音,你更希望眼睛一扫就能看完内容,然后马上进入下一个问题。此外,语音交互还存在滞后性的问题,你必须把整个句子说完整,AI才能理解并作出反应,这经常导致回应错误或答非所问。
再说说摄像头功能。虽然眼镜上的摄像头给用户提供了一个更优雅的拍照选择,但在实际操作中却存在诸多不便。拍照时你仍然需要参考手机取景框里的框格,而且很多时候可能还要蹲下来、摆各种奇怪的角度才能拍好。这用现在的AI眼镜几乎是不能做到的,何况AI眼镜的摄像头性能也必然远低于手机。
因此,笔者认为AI眼镜要想真正普及和发展,就必须向AR眼镜过渡,增加近眼显示功能。只有这样,AI眼镜才能真正发挥出其独特的优势,成为独立于手机的智能设备,为人们的生活带来更多便利和乐趣。
向AR过渡或是催化剂
智能眼镜发展至今,已逐渐分化为三条清晰的技术路线:具备AR功能的智能眼镜、无显示屏的AI眼镜,以及侧重于音频体验的音频眼镜。目前,AR眼镜与AI眼镜的核心差异,除了显示能力外,更体现在交互方式上。AI眼镜采用VUI(语音交互界面),主要依赖语音、TTS(文本转语音)及指示灯进行反馈交互;而AR眼镜则采用GUI(图像交互界面),通过显示、触控以及语音和TTS进行综合交互。
然而,无论是AR眼镜还是AI眼镜,都面临着续航、重量和算力的“不可能三角”难题。与所有智能终端一样,功能越多,能耗越高,而扩大电池容量又会增加眼镜的重量。这一点在AR眼镜上尤为突出,其笨重的头套式设计让许多潜在用户望而却步。尽管无显示屏的AI眼镜在一定程度上减轻了重量,但相比普通眼镜20-30克的轻盈,其45克左右的重量(未配镜片)仍显沉重,配上镜片后重量更是增加,长时间佩戴易感不适。
此外,续航问题也是AI眼镜的一大痛点。相较于手机、相机等手持拍摄设备,Meta等AI眼镜的持续拍摄时间最长也仅约3小时,远不能满足用户长时间使用的需求。
这表明,智能眼镜产品尚未完全定型,无论是AR眼镜还是AI眼镜,在行业真正爆发前,都还有诸多技术问题亟待解决。值得注意的是,AR眼镜正积极融入AI技术,以拓展应用场景;而部分AI眼镜厂商则在努力加强显示能力,以弥补自身短板。
这种趋势的背后,是行业对AR眼镜作为智能眼镜最终形态的普遍认同。有专业人士指出,人类八成以上的信息通过视觉接收,若缺乏影像交互,仅凭AI能力难以成为人类获取信息和服务的新入口。XREAL创始人兼CEO徐驰也曾表示,AR是AI的最佳载体,AI是AR的最优交互方式,这两者很可能是未来十年最能改变消费电子和终端体验的核心技术。
展望未来,智能眼镜的AR与AI技术或许将融为一体。但就目前而言,两者都需面对如何实现规模化、快速渗透市场的挑战。毕竟,即便是行业内的爆款产品Ray-Ban Meta,一年销量也仅100多万台,这一数字对于手机厂商而言,不过是新品发布后几天的销量而已。
在短期内 AR 眼镜用户画像较为模糊背景下,智能音频眼镜以替代耳机功能为切入口,以眼镜(矫正视力/装饰)为载体,搭配 AI 提高体验与卖点,有望开辟音频新赛道。
在“百镜大赛”背景下,目前很难判断谁是赢家,所以机构投资者仍在关注进入各产品供应链或有相关技术储备厂商。如,光学:水晶光电、歌尔股份、欧菲光、韦尔股份;组装:歌尔股份、亿道信息、天健股份、龙旗科技、佳禾智能等;存储:兆易创新;摄像头:韦尔股份、舜宇光学科技等;SoC:恒玄科技、瑞芯微、中科蓝讯、炬芯科技等;结构件:杰美特、长盈精密;屏幕:京东方-A、华灿光电、JBD(未上市);终端厂:Rokid(未上市)、雷鸟创新(未上市)、Xreal(未上市)、影目(未上市)。