文/VR陀螺 萬(wàn)里
今年Connect大會(huì)上,扎克伯格拋出了一個(gè)有意思的話題:“讓我特別感興趣的一個(gè)領(lǐng)域是,如何將AI的進(jìn)步與下一代計(jì)算平臺(tái)相結(jié)合。”
伴隨著因ChatGPT爆火而引發(fā)的新一輪熱潮,AI開(kāi)始加速與千行百業(yè)融合,如今年三月微軟宣布將GPT接入Office辦公套件,谷歌將其AI助手Bard集成到谷歌日歷等應(yīng)用全家桶中等。
同樣,對(duì)于AR或者是其他可穿戴式設(shè)備而言,AI也成為了其不可或缺的賣點(diǎn)之一。本文將對(duì)目前AR眼鏡上的主流AI功能進(jìn)行盤點(diǎn),一窺技術(shù)發(fā)展趨勢(shì)。
以AI驅(qū)動(dòng)的可穿戴式設(shè)備,圖源:Humane
早在GPT爆火之前,VR、AR產(chǎn)品中已經(jīng)出現(xiàn)了很多有關(guān)AI的用例,如結(jié)合了AI算法的手勢(shì)識(shí)別、基于AI預(yù)測(cè)用戶的全身追蹤等。不過(guò)這些功能多停留在用戶無(wú)法直接感知的隱性層面?,F(xiàn)如今隨著LLM、AIGC等技術(shù)的發(fā)展,AI進(jìn)一步走到了臺(tái)前。
以Meta最近發(fā)布的新一代智能眼鏡產(chǎn)品Ray-Ban Meta為例,它與老款產(chǎn)品比較重要的差異點(diǎn)在于,產(chǎn)品正式實(shí)現(xiàn)了對(duì)Meta AI的支持。
Meta官網(wǎng)指出,Meta AI由Llama 2大模型驅(qū)動(dòng),并與微軟Bing搜索引擎達(dá)成了合作,目前已經(jīng)可以通過(guò)Instagram、WhatsApp等Meta社交平臺(tái)進(jìn)行訪問(wèn)。
今年Meta Connect期間,扎克伯格對(duì)于Meta AI進(jìn)行了演示(基于其社交APP),Meta AI具備很強(qiáng)的上下文理解能力,可以快速響應(yīng)用戶的各種提問(wèn)。此外,它還集成了Meta的AI圖像生成工具Emu,可以基于用戶的需求生成相應(yīng)的圖片。
圖源:Meta
除應(yīng)用于自家社交平臺(tái),Meta AI還搭載到了自家的硬件產(chǎn)品Ray-Ban Meta中。由于Ray-Ban Meta并沒(méi)有配備屏幕,所以只能以語(yǔ)音的方式輸出,這使得它并不能承擔(dān)太多復(fù)雜的工作。基于發(fā)布會(huì)演示,Meta AI的作用主要體現(xiàn)在兩方面:一是偏向于功能交互的場(chǎng)景,如通過(guò)語(yǔ)音命令拍攝照片,通過(guò)語(yǔ)音將圖片視頻分享到Messenger等;二是充當(dāng)一個(gè)類似于ChatGPT式的AI助手的角色,用戶可以與之進(jìn)行閑聊、詢問(wèn)出行建議等。
除Meta AI外,扎克伯格透露明年將會(huì)為Ray-Ban Meta新增更多AI的能力,如用戶在旅游時(shí)可以通過(guò)AI詢問(wèn)眼前建筑的具體信息;協(xié)助翻譯外語(yǔ)廣告牌上面的內(nèi)容、詢問(wèn)水龍頭的一些維修建議等。
Ray-Ban Meta AI功能的落地離不開(kāi)新處理器驍龍AR1 Gen1的應(yīng)用,據(jù)了解,該處理器可實(shí)現(xiàn)眼鏡側(cè)AI,這使得硬件廠商可以在眼鏡中接入系列AI模型。高通官網(wǎng)指出,驍龍AR1 Gen1搭載了第三代Hexagon NPU和用于視覺(jué)分析的AR級(jí)引擎,可用于增強(qiáng)圖像和音頻質(zhì)量、視覺(jué)搜索、實(shí)時(shí)翻譯等。
近日,雷鳥(niǎo)創(chuàng)新官宣了其下一代AR眼鏡新品雷鳥(niǎo) X2 Lite,產(chǎn)品同樣搭載驍龍AR1 Gen1,具備更強(qiáng)的AI能力也是產(chǎn)品的重要賣點(diǎn)之一,產(chǎn)品可實(shí)現(xiàn)實(shí)時(shí)翻譯、智能出行建議等AI功能。
圖源:Meta
除Ray-Ban Meta以及雷鳥(niǎo)X2 Lite,今年以來(lái)發(fā)布的大多數(shù)AR眼鏡產(chǎn)品均配備了AI相關(guān)能力,比較典型的是致敬未知于今年7月發(fā)布的ARKnovv A1。致敬未知?jiǎng)?chuàng)始人吳德周曾表示,“AI和AR的結(jié)合一定是方向,我們希望能夠深度結(jié)合AI,讓AR眼鏡真正能夠成為更有效率、更好玩的工具。”
產(chǎn)品定位方面,ARKnovv A1與Ray-Ban Meta有較大不同,前者采用分體式設(shè)計(jì),但是補(bǔ)充了雙目Micro-OLED屏幕。此外,前者配備了單目攝像頭,但并不聚焦于拍照攝影,而是用于實(shí)現(xiàn)SLAM等相關(guān)玩法。
在AI功能方面,ARKnovv A1分為了三大塊:基于AI大模型驅(qū)動(dòng)的語(yǔ)音助手、借助攝像頭以及CV實(shí)現(xiàn)的現(xiàn)實(shí)大爆炸(可識(shí)別建筑物、植物、餐廳等)以及基于開(kāi)源繪圖大模型Stable Diffution打造的AI圖生圖功能。
圖源:致敬未知
近日,李未可CEO茹憶公布了其下一代AR眼鏡李未可Meta Lens S3。茹憶認(rèn)為,當(dāng)下AI在交互計(jì)算平臺(tái)領(lǐng)域的重要性越來(lái)越突出,AI交互能力將成為AR眼鏡的核心能力。
產(chǎn)品方面,李未可團(tuán)隊(duì)正在將AI大模型深度整合到AR眼鏡中,AI模型采用“重云輕端 云端一體”的搭建模式,云端構(gòu)建以認(rèn)知、推理、服務(wù)、任務(wù)等模型為基礎(chǔ)的AI大腦,并實(shí)時(shí)響應(yīng)AR終端的用戶需求。
可以發(fā)現(xiàn),如何結(jié)合AI為用戶提供更加高頻更加有趣的玩法已經(jīng)變成了如今AR/智能眼鏡產(chǎn)品所探討的重要議題。不過(guò)由于產(chǎn)品多聚焦于大眾消費(fèi)市場(chǎng),使得功能也相對(duì)趨同,當(dāng)然也有廠商試圖從中挖掘更加垂直化的用例。
如海外企業(yè)Envision專門面向視障群體開(kāi)發(fā)了一款眼鏡產(chǎn)品Envision Glasses。該產(chǎn)品基于Google Glass Enterprise 2開(kāi)發(fā)而來(lái),產(chǎn)品搭載驍龍XR1,配備800萬(wàn)像素?cái)z像頭。由于產(chǎn)品面向視障群體,它更依賴于AI所支撐的環(huán)境感知以及理解能力,而屏幕或者AR反倒成為了無(wú)關(guān)緊要的功能。
以下是Envision Glasses所對(duì)外展示的一系列用例:
可以掃描書(shū)籍、信件等手寫(xiě)或印刷文本信息并通過(guò)語(yǔ)音的方式向用戶播報(bào),它可識(shí)別超過(guò)60種語(yǔ)言;
借助攝像頭進(jìn)行第一視角的通話;
從一堆白色的衣服中挑出紅色的襪子,判斷室內(nèi)的燈是否亮著;
識(shí)別親人朋友等,提醒用戶打招呼。
圖源:Envision
值得一提的是,Envision的前身是一家OCR和物體識(shí)別應(yīng)用開(kāi)發(fā)商,2017年,企業(yè)上線《Envision AI》APP,該APP同樣瞄準(zhǔn)了視障群體。Envision Glasses需要搭配其手機(jī)APP使用,官網(wǎng)指出眼鏡在正常情況下可提供約5-6小時(shí)的使用時(shí)長(zhǎng)。
圖源:Envision
扎克伯格曾表示眼鏡將會(huì)是AI最佳的硬件載體之一,因?yàn)檠坨R能夠見(jiàn)你所見(jiàn)、聽(tīng)你所聽(tīng),很好洞悉用戶的一切。不過(guò),這并不只是當(dāng)前的唯一解。
今年9月底,The Information爆料稱,OpenAI CEO Sam Altman、軟銀集團(tuán)CEO孫正義與前蘋(píng)果首席設(shè)計(jì)師Jony Ive進(jìn)行了洽談,三方或?qū)⒊闪⒁患覍W⒂谘邪l(fā)新一代AI硬件的新公司,不過(guò)對(duì)于AI時(shí)代下的新硬件究竟會(huì)是什么樣子,目前他們?nèi)詻](méi)有達(dá)成共識(shí)。
10月中旬的WSJ公開(kāi)采訪中,Altman曾表示AI 時(shí)代下計(jì)算機(jī)可以獨(dú)立思考,所以什么樣的硬件都有可能,它或許是新一代手機(jī)、或許是智能音箱、甚至有可能是某種AI驅(qū)動(dòng)的機(jī)器人。不過(guò)外界猜測(cè)稱,關(guān)于前沿AI硬件最佳實(shí)踐或許正是Altman曾多次投資的科技企業(yè)Humane。
圖源:網(wǎng)絡(luò)
Humane團(tuán)隊(duì)打造了一款A(yù)I投影設(shè)備AI Pin,設(shè)備體積小巧,可像一枚胸針一樣掛于胸前。該產(chǎn)品集成了無(wú)喚醒詞的AI助手,除此之外,AI Pin內(nèi)置了一個(gè)投影模組,它可將一些來(lái)電聯(lián)系人等簡(jiǎn)單的信息投射于手掌中。
據(jù)了解,Ai Pin將會(huì)搭載專用系統(tǒng),甚至有可能會(huì)結(jié)合OpenAI的GPT-4,基于過(guò)往的一些案例,用戶可以向設(shè)備發(fā)送撥號(hào)指令、詢問(wèn)就餐建議、旅行安排、檢測(cè)食物卡路里等。此外,Ai Pin的AI助手還將具備一定的上下文聯(lián)系能力。
其他方面,Ai Pin售價(jià)可能會(huì)高達(dá)1000美元,配備高通驍龍芯片,性能可以比肩智能手機(jī)。此前該產(chǎn)品已經(jīng)在9月底的巴黎時(shí)裝秀上有所亮相,并即將于11月9日召開(kāi)新品發(fā)布會(huì)。更多信息可查看VR陀螺過(guò)往文章《iPhone核心團(tuán)隊(duì)成員創(chuàng)業(yè),融資2.3億美元,要做“另類”下一代計(jì)算平臺(tái)》。
圖源:Humane
目前AR眼鏡/智能穿戴仍處于探索期,而AI如何與新一代計(jì)算終端所結(jié)合也同樣如此?;谇懊娴囊恍┯布K端其實(shí)也不難發(fā)現(xiàn),各家廠商對(duì)于AI的理解以及側(cè)重點(diǎn)會(huì)有一定差異,但是共識(shí)是AI將會(huì)在新一代計(jì)算設(shè)備革命中發(fā)揮重要用途。
對(duì)此,茹憶則提出了一個(gè)簡(jiǎn)單明了的觀點(diǎn),如果AR眼鏡是iPhone,那么AI就是iOS,即AI將成為硬件驅(qū)動(dòng)的核心。
從當(dāng)前來(lái)看,眼鏡產(chǎn)品上的AI用例仍多集中于基于LLM的語(yǔ)音助手、簡(jiǎn)單的識(shí)圖功能等,目前體驗(yàn)仍相對(duì)單薄。此外,由于隱私以及設(shè)備續(xù)航所限,設(shè)備的AI能力很多時(shí)候只能處于被動(dòng)觸發(fā)狀態(tài),如只有按下按鈕或者呼出特定語(yǔ)音指令才能有所響應(yīng)(這有點(diǎn)類似于搜索與信息推送的差異)。這種單項(xiàng)互動(dòng)在一定程度上阻礙了AI功能的黏性。
此外,根據(jù)海外平臺(tái)SparkToro調(diào)查數(shù)據(jù),聊天機(jī)器人模型ChatGPT的用戶會(huì)話中,編程協(xié)助以及教育用途最為廣泛,分別達(dá)到了29.1%和11.9%,而聊天互動(dòng)等私人用途占比反而并不算高。未來(lái),如何實(shí)現(xiàn)大語(yǔ)言模型與眼鏡終端更為有機(jī)的結(jié)合也是一個(gè)值得持續(xù)思考的問(wèn)題。
圖源:SparkToro
其他方面,AR眼鏡的算力薄弱,目前仍以云端側(cè)AI為主。高通今年發(fā)布《混合AI是AI的未來(lái)》白皮書(shū)里面提到,云端和終端協(xié)同處理的混合AI是AI的未來(lái),這樣才能高效推動(dòng)AI規(guī)?;涞兀l(fā)揮其最大潛能。隨著端側(cè)AI能力的增強(qiáng),未來(lái)設(shè)備可以構(gòu)建更加個(gè)性化以及安全的AI助手,可以在離線狀態(tài)下工作,并且響應(yīng)速度也會(huì)更快。
而AGI(通用人工智能)是AI的下一個(gè)發(fā)展階段,AGI具備更強(qiáng)的感知、推理與學(xué)習(xí)能力,未來(lái)當(dāng)AGI引入AR眼鏡之后,它的能力將得到更為廣泛的提升。彼時(shí),AR眼鏡將會(huì)成為一個(gè)更加無(wú)感以及智能的設(shè)備。
高通技術(shù)公司產(chǎn)品管理高級(jí)副總裁兼AI負(fù)責(zé)人Ziad Asghar采訪中曾提到,在未來(lái)5年內(nèi),AI將會(huì)成為一個(gè)更加智能的個(gè)人助理,比如當(dāng)告知設(shè)備會(huì)議要遲到了,它將能自動(dòng)給相關(guān)成員發(fā)送消息。
圖源:高通
關(guān)于這一點(diǎn),或許我們能在即將發(fā)布的Ai Pin上面看到相關(guān)解法。Humane的一份專利文件中指出設(shè)備可以結(jié)合用戶的體溫、心率等數(shù)據(jù)來(lái)估算用戶的感情狀態(tài)以及當(dāng)前環(huán)境的重要性,然后會(huì)選擇是否激活麥克風(fēng)攝像頭等。它有點(diǎn)類似于iPhone的相冊(cè)“回憶”功能,但是設(shè)備會(huì)替用戶完成很多隱形的決策工作。
而美國(guó)未來(lái)學(xué)家Devin Liddell則認(rèn)為,在AI技術(shù)的加持下,AR眼鏡將能獲得遠(yuǎn)超普通人類的超級(jí)感官,比如眼鏡可以洞悉用戶的真實(shí)情緒、是否在撒謊等。
比爾蓋茨曾提到,人工智能革命重要程度不亞于手機(jī)和互聯(lián)網(wǎng)的誕生,這是其一生中唯二的革命性技術(shù)進(jìn)步。而未來(lái)AR眼鏡/智能眼鏡在AI的加持之下,也將迸發(fā)出我們難以想象得到的創(chuàng)作力以及生命力。
參考資料:
https://mp.weixin.qq.com/s/npZduUT7FYhlqAdp3SsAiQ
https://mp.weixin.qq.com/s/XMzMACpCwjanMpyba73QVQ
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息