文/VR陀螺 萬里
不出意外,剛結(jié)束的2024年又是被AI狠狠刷屏的一年。
這一年以來,AI曾助推微軟以及英偉達先后登上了全球市值第一的寶座;諾貝爾物理學獎、化學獎兩大重磅獎項均與AI相關,另據(jù)CB Insights數(shù)據(jù)顯示,今年Q3季度,全球有接近1/3的風投都流向了AI初創(chuàng)企業(yè)。
在XR領域,那些已經(jīng)落地亦或是正在籌備的終端產(chǎn)品當中,里面均能看到AI的身影,而AI功能也將成為后續(xù)MR、AR硬件的核心用例之一。本文將回顧這一年以來AI的應用落地盛況。
兩件大事:AI眼鏡起風、兩款AR新品
如果說2023年對于理想AI硬件形態(tài)仍有不少爭論,那么到了2024年,指向性已經(jīng)明確了許多。
去年開春曾有三大重磅AI終端產(chǎn)品:Ray-Ban Meta、Humane Ai Pin以及Rabbit R1,它們分別是眼鏡形態(tài)、胸針形態(tài)以及手持設備形態(tài),從銷量以及用戶反饋來看,眼鏡形態(tài)的Ray-Ban Meta均位于前列。此外,Ray-Ban Meta已經(jīng)于去年銷量突破100萬臺,得到了市場初步驗證。
另外,我們也可以觀察這一年以來一眾頭部AI巨頭的硬件布局以及發(fā)聲:
可以發(fā)現(xiàn),這幾家頭部企業(yè)矛頭所指、寄望于承載未來AI Agent體驗的均為眼鏡設備。那么眼鏡設備的優(yōu)勢在哪里?
在筆者看來,理想的AI硬件需要滿足全天候陪伴、時刻洞察用戶意圖、交流私密等特性,經(jīng)過這幾個條件篩選,眼鏡、AI耳機、類似Humane Ai Pin的可穿戴設備會是潛在選擇。在這其中,眼鏡是綜合之選,原因在于它兼顧了優(yōu)秀的可穿戴屬性。此外,眼鏡里面還可以進一步添加微顯示屏,以補齊視覺信息傳輸媒介。
當然,從今年市場的新品數(shù)量以及熱度來看,眼鏡已然成為了里面的最大贏家。此前VR陀螺曾統(tǒng)計,截至11月底,公開入局AI眼鏡的數(shù)量已經(jīng)達到了36家,產(chǎn)品數(shù)量預計超過了50+。此外,在CES期間,我們又可以看到系列AI眼鏡新品的亮相,如Halliday、雷神科技、XPERT等。
不難預見,新的一年當中,VR/AR行業(yè)的一大重要看點是“百鏡大戰(zhàn)”,而在這其中國內(nèi)的戰(zhàn)況尤為激烈。
Ps:2024可能是眼鏡類產(chǎn)品在命名上最為混亂的一年,去年年初,筆者曾習慣于用智能眼鏡稱呼Ray-Ban Meta這一類不帶屏幕的產(chǎn)品,而AR眼鏡則是帶光學顯示的設備。隨著“AI含金量”日益提升,市場上又衍生出了“智能音頻眼鏡”、“拍攝眼鏡”、“AI眼鏡”、“AI+AR眼鏡”等多個版本。如何讓有關文章不引起歧義,成為了我這一年以來最為頭疼的事情之一。(這里再強調(diào)一遍,AI眼鏡指的是搭載AI功能但缺乏顯示的設備,AR眼鏡則在AI眼鏡基礎之上疊加了顯示屏幕)
從當前來看,需不需要為眼鏡引入光學屏幕(此時便成為了AR眼鏡)仍是一個值得探討的問題,原因在于單從市場表現(xiàn)來看,沒有屏幕的眼鏡產(chǎn)品似乎更受歡迎,原因在于它可以更好控制設備外形體積,此外沒有顯示模組價格也可以更友好。
但不可否認的是,從長遠來看,AR眼鏡是AI眼鏡的發(fā)展必然,并且也將是此類產(chǎn)品的最終形態(tài)。在這一年中,海外的Snap以及Meta為AR眼鏡產(chǎn)品打了個樣。
Spectacles 5:雖然該產(chǎn)品只面向開發(fā)者推出,不過產(chǎn)品完成度已經(jīng)達到了較高水平,眼鏡為一體式形態(tài),運行Snap OS系統(tǒng),支持手勢交互。其他方面,Snap已經(jīng)推出了AR創(chuàng)作平臺Lens Studio 5.0,并通過與OpenAI合作的方式為眼鏡引入了AI能力。
Spectacles 5,圖源:網(wǎng)絡
Meta Orion:這可能是當前市面上做得最為極致的AR眼鏡,它的重量控制在了100g以內(nèi),外形趨近于普通AR眼鏡,并且提供了一整套完備的交互解決方案。在光學選擇上,Meta押注Micro-LED+光波導,基于碳化硅波導將FoV提升到了70°。這款產(chǎn)品代表了Meta長期AR愿景的集中展示,只不過想要在消費市場落地還有一段距離。
Meta Orion,圖源:網(wǎng)絡
AI+AR:多模態(tài)AI上車,今年關鍵詞會是“端到端”以及記憶能力
如果在2023年,可能很多人仍會好奇AR眼鏡的使用場景甚至殺手級用例是什么,而到了現(xiàn)在,答案已經(jīng)逐漸明朗,那便是AI。圍繞AI,今年國內(nèi)外AR廠商逐漸加碼,類似的報道屢見不鮮:
Meta堅定押注AI大模型并積極提升背后的基礎設施建設,并表示到“到2024年底,我們的目標是擁有350000個NVIDIA H100 GPU”;近期也有消息稱,字節(jié)跳動計劃2025年斥資至多70億美元購買英偉達芯片;而小米集團近期也高調(diào)宣布開出千萬年薪挖角AI人才等。
如果從AI應用場景來看,目前的AR眼鏡功能已經(jīng)逐步趨同,如AI助手已經(jīng)成為了很多眼鏡產(chǎn)品的標配,這背后能力高低則主要取決于調(diào)用的大模型。此外,常見的AI功能還包括提詞翻譯、會議紀要等。
除了常見的功能場景外,這里進一步列舉幾個去年曾出現(xiàn)的AI眼鏡產(chǎn)品的創(chuàng)新用例:
雷鳥V3拍攝眼鏡的部分創(chuàng)意用例,圖源:雷鳥創(chuàng)新
2024年年初,筆者曾在年度回顧中曾提到了“多模態(tài)AI”將成為AI眼鏡的標配,并預言“AR眼鏡產(chǎn)品的攝像頭將會成為至關重要的模組之一,攝像頭或許會在AR眼鏡上率先落地,其優(yōu)先級甚至會高于光學屏幕。”
現(xiàn)在再來回看,多模態(tài)AI的確成為了AI眼鏡的一大重要賣點,如Ray-Ban Meta于十二月推送了實時人工智能,AI具備了理解實時視頻的能力;而近期發(fā)布的XREAL One雖然表示不盲目跟風AI,但也同樣配備了一顆攝像頭外設以用于多模態(tài)AI拓展。
那么在新的一年中,AI眼鏡又會有何新趨勢?
圖源:星紀魅族
在體驗方面,眼鏡的AI功能上限無疑直接取決于AI大模型的能力上限。這一年以來AI大模型的各項能力屢創(chuàng)新高,早些時候,我們?nèi)远嘁?ldquo;專家水平”來評價一款出色的AI大模型,而現(xiàn)在隨著GPT-o3等產(chǎn)品的出現(xiàn),它似乎已經(jīng)達到了“博士級別”。
對于這類層出不窮的AI大模型,筆者也已經(jīng)很難用常規(guī)的問題來判別它們AI能力的高低。在這種情況下,我認為AR眼鏡后續(xù)應該卷AI能力包括響應速度、個性化能力等,因為這些指標的提升對于當前用戶感知會更加明顯。
端到端對話。在AI眼鏡興起初期,筆者曾陸陸續(xù)續(xù)體驗了不少同類型產(chǎn)品,當時的痛點主要有幾個,一是調(diào)用AI語音電話時手機APP需要在前臺并且無法熄屏,二是AI響應速度太慢,往往長達數(shù)秒,這很容易讓人失去使用的欲望。
去年GPT-4o的發(fā)布無疑是一個重要的轉(zhuǎn)折,因為它在語音對話方面具有“斷檔式”領先優(yōu)勢,平均響應速度為320ms,對話可以隨時打斷、系統(tǒng)可以理解用戶的情緒語氣,這已經(jīng)與與人類日常對話體驗十分接近。
這種極低水平的延遲背后得益于模型的端到端訓練,即所有輸入和輸出都由同一個神經(jīng)網(wǎng)絡處理。今年以來,國內(nèi)不少廠商其實也看到了端到端AI模型(特別是語音對話式AI)的好處,紛紛展開了相應的研究。如科大訊飛于去年8月發(fā)布的星火極速超擬人交互技術背后應用到了端到端的統(tǒng)一模型框架;而豆包于12月份的火山引擎Force大會上也宣布豆包端到端實時語音模型即將上線。預計在新的一年當中,“端到端”將會成為AR眼鏡更為高頻的詞匯。
圖源:科大訊飛
個性化AI。AI Agent是很多人對于AI的終極幻想,與PC、手機等關注生產(chǎn)力場景的終端不同,AR眼鏡其實更應該滿足我們的陪伴屬性。不過基于筆者對于AR眼鏡類產(chǎn)品的體驗發(fā)現(xiàn),AI在響應用戶需求的時候仍略顯呆板,這是由多方面原因所導致的。
一方面如果我們想要AI更了解我們,那么就需要它對于我們的生活參與更多,如相機、麥克風實時處于響應狀態(tài)等,這對于設備續(xù)航是一個極大的考驗。當然,這背后也涉及到隱私問題。
另一方面,目前AI大模型的“記憶能力”仍是一個稀缺屬性,它們只能機械式記錄特定token數(shù)的上下文信息,因而用戶與之互動過程中會明顯感覺到一種“隔閡”,難以產(chǎn)生體驗黏性。(如果能實現(xiàn)這一點,現(xiàn)如今林林總總的年度報告簡直不值一提。)
好消息是,關于超強記憶AI似乎很快迎來重要突破,微軟AI CEO Mustafa Suleyman早些時候接受采訪時曾提到,微軟正在開發(fā)具有“近乎無限”內(nèi)存功能的技術。這項進步預計將于2025年實現(xiàn),它將使AI能夠無限期地保留信息,從而改變用戶參與度。
無獨有偶,近日OpenAI CEO Sam Altman公布了公司的新目標,“更好的記憶力,更長的上下文”赫然在列。
圖源:X
功能落地方面,去年年末Meta以及谷歌均展示了帶短暫記憶能力的AI功能體驗,如Ray-Ban Meta可以幫你記住停車位置、搭載Android XR的眼鏡可以幫你記住大門的密碼鎖等。谷歌近期所更新的AI助手Project Astra也以“記憶”作為重要功能之一,據(jù)悉可以記住過去互動的背景信息。
Project Astra,圖源:Deepmind
AI+VR:處理器性能飆升帶來的AI功能拓展
雖說“AI+眼鏡”是最具想象力的場景,不過對于MR產(chǎn)品而言,AI相關用例也明顯提升。
背后原因可能有兩點,一是AI已經(jīng)成為一種重要營銷手段,二是去年的拳頭產(chǎn)品,如PICO 4 Ultra、Quest 3S以及Project Moohan等,處理器升級為了驍龍XR2 Gen 2/+處理器,它具備更強的AI算力。以下是部分頭顯產(chǎn)品曾展示的一些AI功能體驗:
Quest 3/3S:今年7月,Meta為頭顯上線了Meta AI,可以通過雙擊手柄的Meta按鈕喚醒。對于支持全彩VST的設備,設備可以實現(xiàn)視覺搜索功能,如詢問花園的植物品種等。
PICO 4 Ultra:內(nèi)置了AI生成桌面背景、AI 2D抖音短視頻轉(zhuǎn)3D等玩法。
Project Moohan:配備了與AI深度融合的Android XR系統(tǒng),它在玩法方面相比前兩者更勝一籌,如可以實現(xiàn)系統(tǒng)級響應,實時在線,并支持語音交互以及視覺搜索等。
筆者認為如果在輕度辦公場景下,Project Moohan由于得益于大屏+AI屬性,它的生產(chǎn)力并不一定會弱于目前的PC設備。當然后續(xù)更多功能還有待進一步觀望。
畫圈搜索功能展示,圖源:谷歌
寫在最后:新一年將繼續(xù)喧囂
2025年,無疑是“AI+XR”賽道更為熱鬧的一年,對于AI眼鏡,前面提到字節(jié)跳動、小米等巨頭將會進場、Ray-Ban Meta會推出帶屏迭代款;對于AR眼鏡,預計三星、谷歌等廠商會有新品發(fā)布;對于MR頭顯,有傳言稱VIVO將會在這一年入局。
隨著這些新企業(yè)的入局,“AI+XR”新品在價格、功能場景以及品牌影響力等方面都會給市場帶來“巨頭震撼”,市場會經(jīng)歷一次大浪淘沙。
在筆者看來,今年有兩個值得持續(xù)關注的地方,首先谷歌在去年年末發(fā)布了XR操作系統(tǒng)Android XR,預計今年會有不少品牌“上車”。它的出現(xiàn),有利于降低XR行業(yè)的準入門檻。
此外,筆者認為眼鏡并非“AI載體”的唯一解,新的一年中可能會出現(xiàn)更多全新的終端形態(tài)。
新的一年,讓我們攜手前進。
投稿/爆料:tougao@youxituoluo.com
稿件/商務合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文為VR陀螺原創(chuàng),任何第三方未經(jīng)授權(quán)不得轉(zhuǎn)載。如需轉(zhuǎn)載請聯(lián)系微信:vrtuoluo233 申請授權(quán),并在轉(zhuǎn)載時保留轉(zhuǎn)載來源、作者以及原文鏈接信息,不得擅自更改內(nèi)容,違規(guī)轉(zhuǎn)載法律必究。文中有圖片、視頻素材來自互聯(lián)網(wǎng)或無法核實出處,如涉及版權(quán)問題,請聯(lián)系本網(wǎng)站協(xié)商處理。
元宇宙數(shù)字產(chǎn)業(yè)服務平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息