文/VR陀螺 萬(wàn)里
不出意外,剛結(jié)束的2024年又是被AI狠狠刷屏的一年。
這一年以來(lái),AI曾助推微軟以及英偉達(dá)先后登上了全球市值第一的寶座;諾貝爾物理學(xué)獎(jiǎng)、化學(xué)獎(jiǎng)兩大重磅獎(jiǎng)項(xiàng)均與AI相關(guān),另?yè)?jù)CB Insights數(shù)據(jù)顯示,今年Q3季度,全球有接近1/3的風(fēng)投都流向了AI初創(chuàng)企業(yè)。
在XR領(lǐng)域,那些已經(jīng)落地亦或是正在籌備的終端產(chǎn)品當(dāng)中,里面均能看到AI的身影,而AI功能也將成為后續(xù)MR、AR硬件的核心用例之一。本文將回顧這一年以來(lái)AI的應(yīng)用落地盛況。
兩件大事:AI眼鏡起風(fēng)、兩款A(yù)R新品
如果說(shuō)2023年對(duì)于理想AI硬件形態(tài)仍有不少爭(zhēng)論,那么到了2024年,指向性已經(jīng)明確了許多。
去年開(kāi)春曾有三大重磅AI終端產(chǎn)品:Ray-Ban Meta、Humane Ai Pin以及Rabbit R1,它們分別是眼鏡形態(tài)、胸針形態(tài)以及手持設(shè)備形態(tài),從銷量以及用戶反饋來(lái)看,眼鏡形態(tài)的Ray-Ban Meta均位于前列。此外,Ray-Ban Meta已經(jīng)于去年銷量突破100萬(wàn)臺(tái),得到了市場(chǎng)初步驗(yàn)證。
另外,我們也可以觀察這一年以來(lái)一眾頭部AI巨頭的硬件布局以及發(fā)聲:
可以發(fā)現(xiàn),這幾家頭部企業(yè)矛頭所指、寄望于承載未來(lái)AI Agent體驗(yàn)的均為眼鏡設(shè)備。那么眼鏡設(shè)備的優(yōu)勢(shì)在哪里?
在筆者看來(lái),理想的AI硬件需要滿足全天候陪伴、時(shí)刻洞察用戶意圖、交流私密等特性,經(jīng)過(guò)這幾個(gè)條件篩選,眼鏡、AI耳機(jī)、類似Humane Ai Pin的可穿戴設(shè)備會(huì)是潛在選擇。在這其中,眼鏡是綜合之選,原因在于它兼顧了優(yōu)秀的可穿戴屬性。此外,眼鏡里面還可以進(jìn)一步添加微顯示屏,以補(bǔ)齊視覺(jué)信息傳輸媒介。
當(dāng)然,從今年市場(chǎng)的新品數(shù)量以及熱度來(lái)看,眼鏡已然成為了里面的最大贏家。此前VR陀螺曾統(tǒng)計(jì),截至11月底,公開(kāi)入局AI眼鏡的數(shù)量已經(jīng)達(dá)到了36家,產(chǎn)品數(shù)量預(yù)計(jì)超過(guò)了50+。此外,在CES期間,我們又可以看到系列AI眼鏡新品的亮相,如Halliday、雷神科技、XPERT等。
不難預(yù)見(jiàn),新的一年當(dāng)中,VR/AR行業(yè)的一大重要看點(diǎn)是“百鏡大戰(zhàn)”,而在這其中國(guó)內(nèi)的戰(zhàn)況尤為激烈。
Ps:2024可能是眼鏡類產(chǎn)品在命名上最為混亂的一年,去年年初,筆者曾習(xí)慣于用智能眼鏡稱呼Ray-Ban Meta這一類不帶屏幕的產(chǎn)品,而AR眼鏡則是帶光學(xué)顯示的設(shè)備。隨著“AI含金量”日益提升,市場(chǎng)上又衍生出了“智能音頻眼鏡”、“拍攝眼鏡”、“AI眼鏡”、“AI+AR眼鏡”等多個(gè)版本。如何讓有關(guān)文章不引起歧義,成為了我這一年以來(lái)最為頭疼的事情之一。(這里再?gòu)?qiáng)調(diào)一遍,AI眼鏡指的是搭載AI功能但缺乏顯示的設(shè)備,AR眼鏡則在AI眼鏡基礎(chǔ)之上疊加了顯示屏幕)
從當(dāng)前來(lái)看,需不需要為眼鏡引入光學(xué)屏幕(此時(shí)便成為了AR眼鏡)仍是一個(gè)值得探討的問(wèn)題,原因在于單從市場(chǎng)表現(xiàn)來(lái)看,沒(méi)有屏幕的眼鏡產(chǎn)品似乎更受歡迎,原因在于它可以更好控制設(shè)備外形體積,此外沒(méi)有顯示模組價(jià)格也可以更友好。
但不可否認(rèn)的是,從長(zhǎng)遠(yuǎn)來(lái)看,AR眼鏡是AI眼鏡的發(fā)展必然,并且也將是此類產(chǎn)品的最終形態(tài)。在這一年中,海外的Snap以及Meta為AR眼鏡產(chǎn)品打了個(gè)樣。
Spectacles 5:雖然該產(chǎn)品只面向開(kāi)發(fā)者推出,不過(guò)產(chǎn)品完成度已經(jīng)達(dá)到了較高水平,眼鏡為一體式形態(tài),運(yùn)行Snap OS系統(tǒng),支持手勢(shì)交互。其他方面,Snap已經(jīng)推出了AR創(chuàng)作平臺(tái)Lens Studio 5.0,并通過(guò)與OpenAI合作的方式為眼鏡引入了AI能力。
Spectacles 5,圖源:網(wǎng)絡(luò)
Meta Orion:這可能是當(dāng)前市面上做得最為極致的AR眼鏡,它的重量控制在了100g以內(nèi),外形趨近于普通AR眼鏡,并且提供了一整套完備的交互解決方案。在光學(xué)選擇上,Meta押注Micro-LED+光波導(dǎo),基于碳化硅波導(dǎo)將FoV提升到了70°。這款產(chǎn)品代表了Meta長(zhǎng)期AR愿景的集中展示,只不過(guò)想要在消費(fèi)市場(chǎng)落地還有一段距離。
Meta Orion,圖源:網(wǎng)絡(luò)
AI+AR:多模態(tài)AI上車,今年關(guān)鍵詞會(huì)是“端到端”以及記憶能力
如果在2023年,可能很多人仍會(huì)好奇AR眼鏡的使用場(chǎng)景甚至殺手級(jí)用例是什么,而到了現(xiàn)在,答案已經(jīng)逐漸明朗,那便是AI。圍繞AI,今年國(guó)內(nèi)外AR廠商逐漸加碼,類似的報(bào)道屢見(jiàn)不鮮:
Meta堅(jiān)定押注AI大模型并積極提升背后的基礎(chǔ)設(shè)施建設(shè),并表示到“到2024年底,我們的目標(biāo)是擁有350000個(gè)NVIDIA H100 GPU”;近期也有消息稱,字節(jié)跳動(dòng)計(jì)劃2025年斥資至多70億美元購(gòu)買(mǎi)英偉達(dá)芯片;而小米集團(tuán)近期也高調(diào)宣布開(kāi)出千萬(wàn)年薪挖角AI人才等。
如果從AI應(yīng)用場(chǎng)景來(lái)看,目前的AR眼鏡功能已經(jīng)逐步趨同,如AI助手已經(jīng)成為了很多眼鏡產(chǎn)品的標(biāo)配,這背后能力高低則主要取決于調(diào)用的大模型。此外,常見(jiàn)的AI功能還包括提詞翻譯、會(huì)議紀(jì)要等。
除了常見(jiàn)的功能場(chǎng)景外,這里進(jìn)一步列舉幾個(gè)去年曾出現(xiàn)的AI眼鏡產(chǎn)品的創(chuàng)新用例:
雷鳥(niǎo)V3拍攝眼鏡的部分創(chuàng)意用例,圖源:雷鳥(niǎo)創(chuàng)新
2024年年初,筆者曾在年度回顧中曾提到了“多模態(tài)AI”將成為AI眼鏡的標(biāo)配,并預(yù)言“AR眼鏡產(chǎn)品的攝像頭將會(huì)成為至關(guān)重要的模組之一,攝像頭或許會(huì)在AR眼鏡上率先落地,其優(yōu)先級(jí)甚至?xí)哂诠鈱W(xué)屏幕。”
現(xiàn)在再來(lái)回看,多模態(tài)AI的確成為了AI眼鏡的一大重要賣(mài)點(diǎn),如Ray-Ban Meta于十二月推送了實(shí)時(shí)人工智能,AI具備了理解實(shí)時(shí)視頻的能力;而近期發(fā)布的XREAL One雖然表示不盲目跟風(fēng)AI,但也同樣配備了一顆攝像頭外設(shè)以用于多模態(tài)AI拓展。
那么在新的一年中,AI眼鏡又會(huì)有何新趨勢(shì)?
圖源:星紀(jì)魅族
在體驗(yàn)方面,眼鏡的AI功能上限無(wú)疑直接取決于AI大模型的能力上限。這一年以來(lái)AI大模型的各項(xiàng)能力屢創(chuàng)新高,早些時(shí)候,我們?nèi)远嘁?ldquo;專家水平”來(lái)評(píng)價(jià)一款出色的AI大模型,而現(xiàn)在隨著GPT-o3等產(chǎn)品的出現(xiàn),它似乎已經(jīng)達(dá)到了“博士級(jí)別”。
對(duì)于這類層出不窮的AI大模型,筆者也已經(jīng)很難用常規(guī)的問(wèn)題來(lái)判別它們AI能力的高低。在這種情況下,我認(rèn)為AR眼鏡后續(xù)應(yīng)該卷AI能力包括響應(yīng)速度、個(gè)性化能力等,因?yàn)檫@些指標(biāo)的提升對(duì)于當(dāng)前用戶感知會(huì)更加明顯。
端到端對(duì)話。在AI眼鏡興起初期,筆者曾陸陸續(xù)續(xù)體驗(yàn)了不少同類型產(chǎn)品,當(dāng)時(shí)的痛點(diǎn)主要有幾個(gè),一是調(diào)用AI語(yǔ)音電話時(shí)手機(jī)APP需要在前臺(tái)并且無(wú)法熄屏,二是AI響應(yīng)速度太慢,往往長(zhǎng)達(dá)數(shù)秒,這很容易讓人失去使用的欲望。
去年GPT-4o的發(fā)布無(wú)疑是一個(gè)重要的轉(zhuǎn)折,因?yàn)樗谡Z(yǔ)音對(duì)話方面具有“斷檔式”領(lǐng)先優(yōu)勢(shì),平均響應(yīng)速度為320ms,對(duì)話可以隨時(shí)打斷、系統(tǒng)可以理解用戶的情緒語(yǔ)氣,這已經(jīng)與與人類日常對(duì)話體驗(yàn)十分接近。
這種極低水平的延遲背后得益于模型的端到端訓(xùn)練,即所有輸入和輸出都由同一個(gè)神經(jīng)網(wǎng)絡(luò)處理。今年以來(lái),國(guó)內(nèi)不少?gòu)S商其實(shí)也看到了端到端AI模型(特別是語(yǔ)音對(duì)話式AI)的好處,紛紛展開(kāi)了相應(yīng)的研究。如科大訊飛于去年8月發(fā)布的星火極速超擬人交互技術(shù)背后應(yīng)用到了端到端的統(tǒng)一模型框架;而豆包于12月份的火山引擎Force大會(huì)上也宣布豆包端到端實(shí)時(shí)語(yǔ)音模型即將上線。預(yù)計(jì)在新的一年當(dāng)中,“端到端”將會(huì)成為AR眼鏡更為高頻的詞匯。
圖源:科大訊飛
個(gè)性化AI。AI Agent是很多人對(duì)于AI的終極幻想,與PC、手機(jī)等關(guān)注生產(chǎn)力場(chǎng)景的終端不同,AR眼鏡其實(shí)更應(yīng)該滿足我們的陪伴屬性。不過(guò)基于筆者對(duì)于AR眼鏡類產(chǎn)品的體驗(yàn)發(fā)現(xiàn),AI在響應(yīng)用戶需求的時(shí)候仍略顯呆板,這是由多方面原因所導(dǎo)致的。
一方面如果我們想要AI更了解我們,那么就需要它對(duì)于我們的生活參與更多,如相機(jī)、麥克風(fēng)實(shí)時(shí)處于響應(yīng)狀態(tài)等,這對(duì)于設(shè)備續(xù)航是一個(gè)極大的考驗(yàn)。當(dāng)然,這背后也涉及到隱私問(wèn)題。
另一方面,目前AI大模型的“記憶能力”仍是一個(gè)稀缺屬性,它們只能機(jī)械式記錄特定token數(shù)的上下文信息,因而用戶與之互動(dòng)過(guò)程中會(huì)明顯感覺(jué)到一種“隔閡”,難以產(chǎn)生體驗(yàn)黏性。(如果能實(shí)現(xiàn)這一點(diǎn),現(xiàn)如今林林總總的年度報(bào)告簡(jiǎn)直不值一提。)
好消息是,關(guān)于超強(qiáng)記憶AI似乎很快迎來(lái)重要突破,微軟AI CEO Mustafa Suleyman早些時(shí)候接受采訪時(shí)曾提到,微軟正在開(kāi)發(fā)具有“近乎無(wú)限”內(nèi)存功能的技術(shù)。這項(xiàng)進(jìn)步預(yù)計(jì)將于2025年實(shí)現(xiàn),它將使AI能夠無(wú)限期地保留信息,從而改變用戶參與度。
無(wú)獨(dú)有偶,近日OpenAI CEO Sam Altman公布了公司的新目標(biāo),“更好的記憶力,更長(zhǎng)的上下文”赫然在列。
圖源:X
功能落地方面,去年年末Meta以及谷歌均展示了帶短暫記憶能力的AI功能體驗(yàn),如Ray-Ban Meta可以幫你記住停車位置、搭載Android XR的眼鏡可以幫你記住大門(mén)的密碼鎖等。谷歌近期所更新的AI助手Project Astra也以“記憶”作為重要功能之一,據(jù)悉可以記住過(guò)去互動(dòng)的背景信息。
Project Astra,圖源:Deepmind
AI+VR:處理器性能飆升帶來(lái)的AI功能拓展
雖說(shuō)“AI+眼鏡”是最具想象力的場(chǎng)景,不過(guò)對(duì)于MR產(chǎn)品而言,AI相關(guān)用例也明顯提升。
背后原因可能有兩點(diǎn),一是AI已經(jīng)成為一種重要營(yíng)銷手段,二是去年的拳頭產(chǎn)品,如PICO 4 Ultra、Quest 3S以及Project Moohan等,處理器升級(jí)為了驍龍XR2 Gen 2/+處理器,它具備更強(qiáng)的AI算力。以下是部分頭顯產(chǎn)品曾展示的一些AI功能體驗(yàn):
Quest 3/3S:今年7月,Meta為頭顯上線了Meta AI,可以通過(guò)雙擊手柄的Meta按鈕喚醒。對(duì)于支持全彩VST的設(shè)備,設(shè)備可以實(shí)現(xiàn)視覺(jué)搜索功能,如詢問(wèn)花園的植物品種等。
PICO 4 Ultra:內(nèi)置了AI生成桌面背景、AI 2D抖音短視頻轉(zhuǎn)3D等玩法。
Project Moohan:配備了與AI深度融合的Android XR系統(tǒng),它在玩法方面相比前兩者更勝一籌,如可以實(shí)現(xiàn)系統(tǒng)級(jí)響應(yīng),實(shí)時(shí)在線,并支持語(yǔ)音交互以及視覺(jué)搜索等。
筆者認(rèn)為如果在輕度辦公場(chǎng)景下,Project Moohan由于得益于大屏+AI屬性,它的生產(chǎn)力并不一定會(huì)弱于目前的PC設(shè)備。當(dāng)然后續(xù)更多功能還有待進(jìn)一步觀望。
畫(huà)圈搜索功能展示,圖源:谷歌
寫(xiě)在最后:新一年將繼續(xù)喧囂
2025年,無(wú)疑是“AI+XR”賽道更為熱鬧的一年,對(duì)于AI眼鏡,前面提到字節(jié)跳動(dòng)、小米等巨頭將會(huì)進(jìn)場(chǎng)、Ray-Ban Meta會(huì)推出帶屏迭代款;對(duì)于AR眼鏡,預(yù)計(jì)三星、谷歌等廠商會(huì)有新品發(fā)布;對(duì)于MR頭顯,有傳言稱VIVO將會(huì)在這一年入局。
隨著這些新企業(yè)的入局,“AI+XR”新品在價(jià)格、功能場(chǎng)景以及品牌影響力等方面都會(huì)給市場(chǎng)帶來(lái)“巨頭震撼”,市場(chǎng)會(huì)經(jīng)歷一次大浪淘沙。
在筆者看來(lái),今年有兩個(gè)值得持續(xù)關(guān)注的地方,首先谷歌在去年年末發(fā)布了XR操作系統(tǒng)Android XR,預(yù)計(jì)今年會(huì)有不少品牌“上車”。它的出現(xiàn),有利于降低XR行業(yè)的準(zhǔn)入門(mén)檻。
此外,筆者認(rèn)為眼鏡并非“AI載體”的唯一解,新的一年中可能會(huì)出現(xiàn)更多全新的終端形態(tài)。
新的一年,讓我們攜手前進(jìn)。