文/VR陀螺
1月13日,VR陀螺 總經理兼主編 案山子 連線博士眼鏡 董事總經理 范勤、雷鳥創(chuàng)新 CEO 李宏偉、億境虛擬 CEO 石慶進行了一場深度連線直播。
直播主題為【傳統(tǒng)與科技碰撞,井噴的AI眼鏡何去何從】,嘉賓結合今年CES 2025的參展經歷,深入探討了當前AI眼鏡市場的潛在機遇、落地難點以及未來的發(fā)展趨勢。以下是直播文字實錄。(為照顧閱讀,部分語序略有調整。讀者亦可前往VR陀螺視頻號觀看直播回放)
案山子:我們剛剛結束了CES展會的活動,首先我想聽聽大家對于CES整體參會感受如何?
范勤:這是我首次參加CES,因此我感到非常興奮。有一篇報道將CES視為人類洞察科技的未來之窗,我認為這個比喻非常好,因為它體現(xiàn)了科技的巨大進步。在這次體驗中,我注意到人工智能的應用場景非常的廣泛,除了我們最為熟悉的智能眼鏡,我還注意到了人工智能在寵物陪伴、醫(yī)療教育等方面的應用,這讓我感受到AI已經從理論概念真正走入了我們的日常生活。
許多報道都在探討AI是否會迅速取代人類生活的許多方面,甚至導致許多人失業(yè)。我?guī)е@樣一個疑問和想法去觀察。確實,AI技術讓生活變得更加便利。然而,在我看來,AI全面替代人類在某些領域,比如我們這個行業(yè),可能還需要時間。此外,通過這次活動,我有一個深刻的感受,就是現(xiàn)場來了非常多中國企業(yè),聽說累計企業(yè)共4000多家,而中國就占了1500多家。海外的中國企業(yè)隨處可見,這讓我感到極為自豪。同時,也為中國企業(yè)成功走出國門而驕傲。于此同時,我也深切感受到中國市場的競爭激烈,以及中國企業(yè)面臨的巨大挑戰(zhàn),轉向海外市場確實不易。
展會期間,我最先去到雷鳥的展廳體驗了V3這款產品,它剛好在1月7日發(fā)布,整體感覺非常輕便,很貼近生活,已經可以成為我們全天候佩戴的眼鏡。此外,我在現(xiàn)場也關注了其他一些公司,例如Rokid、XREAL、李未可等幾十家AI/AR公司,感覺整個賽道確實非?;馃?,AI眼鏡受到了廣泛的關注。我相信隨著資本的進入和技術的進步,整個AI眼鏡行業(yè)將加快發(fā)展步伐。
李宏偉:因為我參加CES的次數(shù)較多,并且提前與許多合作伙伴都進行了交流,所以我想分享幾點我看到的趨勢變化。首先,如果大家還記得去年的CES的話,會發(fā)現(xiàn)一個顯著的變化:在上一次的CES上,有很多令人關注的AI硬件產品,但實際效果并不理想;而今年,AI落地產品變得更加成熟,或者說有一個質變,就是它們確實能被大家接受了。
關于本次展示的AI硬件,包括但不限于AI眼鏡、AI寵物、AI機器人等,實際上它們已經獲得了大眾用戶的接納,日常使用率非常高。其中,許多陪伴型機器人開始實行訂閱制模式,這是一個顯著的變化。觀察技術的演進過程一直讓我覺得非常有趣,也讓我對AI在未來能夠被廣泛應用并成為用戶持續(xù)使用的產品充滿信心。
第二,正如之前提到的,我們已經觀察到AI在CES領域的滲透率正持續(xù)上升。根據(jù)今年的情況,雖然可能不是百分之百,但也接近百分之百了,我認為這是一個積極的趨勢。CES不僅僅是消費電子展,背后同樣有驅動消費電子發(fā)展的技術。近年來,AI技術取得了重大進展,我們看到它如何被應用于硬件以及服務于用戶,改變生活,這是非常積極的一方面。
第三,我們身處眼鏡行業(yè),我確實看到了AI眼鏡市場呈現(xiàn)出百花齊放的態(tài)勢,無論你走到哪里,只要再走50米,就能看到一些或熟悉或不熟悉的做AI眼鏡的團隊,我覺得這是非常好的現(xiàn)象。我有一個看法,AI眼鏡是推動AI及其整個產業(yè)未來發(fā)展極為關鍵的環(huán)節(jié),其作用甚至可能僅次于AI本身。因為AI背后依賴于收集大量高質量的現(xiàn)實世界數(shù)據(jù),而眼鏡恰好是收集此類數(shù)據(jù)的理想產品。
舉例來說,當我們使用雷鳥V3時,比如拿起一個水瓶喝水,在這個過程中,AI眼鏡不僅收集了桌子和水杯的靜態(tài)信息,還觀察到了我們拿起水杯等具備意圖和互動行為的數(shù)據(jù),這些數(shù)據(jù)對AI的發(fā)展至關重要,特別是在機器人領域。機器人如果想要理解現(xiàn)實世界,它背后就需要具備類似眼鏡的多模態(tài)、第一視角的大模型。其次,機器人還需要能夠與現(xiàn)實世界互動,具備主動行為的能力?,F(xiàn)在很多人在做AI眼鏡,我認為從長遠來看,這不僅利于AI眼鏡產業(yè)本身,它對整個AI產業(yè)的發(fā)展都將帶來巨大的推動作用。
雷鳥創(chuàng)新在CES,圖源:VR陀螺
石慶:在今年的CES上,我注意到一個顯著的趨勢,即越來越多的AI產品實現(xiàn)落地,且質量頗佳。以AI玩具為例,不論是觸感,還是對話互動,一些產品都做得十分出色,能為用戶提供豐富的情感價值。
聚焦到我們所處的行業(yè),AI眼鏡作為連接物理世界與AI后端的重要interface,無疑是最佳的硬件載體。與往屆CES相比,今年AI眼鏡成為了熱議焦點,而MR產品的熱度則相對有所減弱,且未出現(xiàn)特別突出的亮點。我注意到,盡管頭顯在教育、游戲和電影展示的機會仍然存在,但行業(yè)重點已明顯向AR和AI領域傾斜。
回到AI眼鏡,億境目前發(fā)布的AI眼鏡尚不帶顯示功能,不過下一步我們也會考慮研發(fā)帶顯示的版本。畢竟AR眼鏡的反應速度更快,能夠讓人更迅速地獲取AI反饋。
案山子:目前市場上的眼鏡產品主要分為以下幾個版本——純音頻眼鏡、集成音頻和攝像頭的拍攝眼鏡、帶顯示的眼鏡。在各位看來這三個產品之間的邏輯關系是怎樣的?
李宏偉:我認為,從長遠來看,這是一個過渡關系。這里面有幾個明確的要素,首先是,我們到底需不需要顯示,我覺得顯示這個事情具備很強的直覺性,這是人機交互的關鍵,蘋果喬布斯在產品設計中有一個核心原則是產品是否符合用戶的直覺。以不帶顯示的AI眼鏡為例,在翻譯場景中,我們在商場導航看到幾家餐廳,如果沒有屏幕輔助,就難以分辨出語音指令所輸出的是哪一家的信息。因此,顯示信息對于用戶來說是非常直觀且重要的,隨著眼鏡技術的發(fā)展,特別是顯示技術的進步和虛擬現(xiàn)實的融合,這將是一個確定性的發(fā)展趨勢。
第二個問題是關于其替代性和過渡性,其中關鍵在于AR眼鏡是否可以作為一個通用計算平臺。以手機為例,盡管市場上有各種拍照和聽歌設備,如相機、音樂播放器、手表等,這些市場雖然相對較小,但仍然存在。因此,通用計算平臺往往具有較好的兼容性,尤其是對于這些小場景的兼容性。它應用場景更為豐富,所蘊含的勢能更強大?;谶@兩個原因,我認為當前某些不帶顯示的產品是過渡產品。
第三點,這當然是一個技術問題,或者說TPMF(Technology Product Market Fit )的問題,隨著技術的發(fā)展,有顯示眼鏡和沒有顯示眼鏡的成本差距將會縮小,包括佩戴成本和其他相關成本,屆時這種效果將會顯現(xiàn)。另外,我想談一下對時間的看法。我對未來持樂觀態(tài)度,預計到2026年,帶顯示的AR眼鏡將會出現(xiàn)爆發(fā)。到2028年,AR會具有比較好的顯示以及虛實融合效果。
對于這幾種產品的市場規(guī)模,我認為帶不帶顯示屏幕的AI眼鏡(含AI拍攝眼鏡、AI+AR眼鏡)在接下來兩年都會迎來蓬勃發(fā)展。今年我們估計全球可能會有大幾百萬的出貨量,明年預計能夠到千萬級。因為這類一旦出現(xiàn)了這個壓倒性的產品設計之后,它的增長速度會非??臁_@其中,帶顯示AR眼鏡可能會稍晚一點,但是我們判斷 2026年以后也會迎來快速的爆發(fā),也許2026年的時候這個類型的只是一個百萬或幾百萬的量,但到很快就會出現(xiàn)一個倍數(shù)甚至十倍數(shù)的增長,并保持翻倍或更高倍速的發(fā)展。
石慶:我也認同不帶顯示功能的AI眼鏡將長期存在的觀點,因為這類產品輕巧便攜,在輕量化與舒適化方面優(yōu)勢明顯,一定會持續(xù)存在。不過,其何時達到市場平衡點以及具體變化趨勢,目前還難以精準預判。另外,帶攝像頭但不帶顯示的眼鏡會搶占純藍牙設備的市場份額。因為聲音的input、output以及影像輸入功能的轉變速度會更快,產品在兼顧輕量化與數(shù)字化的過程中,所面臨的壓力相對較小。
然而在顯示領域,我們預計還需等待18至24個月,相關技術才有望逐漸成為主流。一方面,成本與功耗是必須考量的因素;另一方面,應用場景及使用體驗也至關重要。畢竟,帶顯示的眼鏡視野中間會有遮擋,用戶需要一定時間去適應。當然,隨著攝像頭和顯示器的不斷普及,當其達到一定普及程度后,我預測音頻眼鏡或僅有攝像頭的眼鏡的市場可能會被逐漸侵蝕。因為對經常佩戴眼鏡出門的用戶來說,這幾類產品的價格差異可能僅在三位數(shù)內,而帶顯示的眼鏡功能更豐富且能兼顧佩戴體驗,他們大概率不會傾向于選擇功能單一的低配眼鏡。
億境虛擬在CES,圖源:網絡
案山子:由于科技領域與傳統(tǒng)領域之間存在一定的隔閡,可能各自的視角會有所差異。各位認為普通用戶在選擇眼鏡時最為看重的幾個因素是什么?
范勤:眼鏡市場在中國的容量大約接近1000億,其實在Ray-Ban Meta這款現(xiàn)象級產品出現(xiàn)之前,眼鏡行業(yè)受到市場的關注度并不算高。這股AI眼鏡熱潮正在到來,作為一名眼鏡從業(yè)者,我感到非常興奮,因為智能眼鏡的出現(xiàn)為我們提供了一個新的機會,提高了市場對整個行業(yè)的關注度,為眼鏡行業(yè)帶來了新的增量。
就我個人的理解而言,智能眼鏡的發(fā)展不僅僅是智能硬件的進步,包括模組的不斷變小和變輕。同時,隨著AI大模型的接入,眼鏡的智能化浪潮正在到來。這使得智能眼鏡從最初因過重而無法長時間佩戴,到現(xiàn)在可以全天候佩戴,并且款式接近于我們大多數(shù)人能夠接受的程度。普通眼鏡的重量大多在30-40克之間,消費者是可以接受的。而目前智能眼鏡的重量大約在50克左右,像雷鳥V3做到了39克,消費者的反饋相當不錯。
另外一點在于,不同消費者之間需求都是獨特的,部分用戶認為眼鏡音頻和AI交互的結合已經能滿足部分需求,也有用戶對于拍攝有獨特需求。除了剛才提到的音視頻功能外,我認為未來AI眼鏡可能會出現(xiàn)各種不同的場景。例如,在醫(yī)療、教育和運動領域的應用等。當然,如果一個眼鏡上需要集成更多的功能,那么對它的要求就會更加高。
案山子:能否聊聊普通眼鏡市場的設備更換周期、價格、應用場景、SKU等問題?
范勤:在國內,消費者通常購買眼鏡的周期在一年到一年半不等。然而,現(xiàn)在的消費者與以往不同,他們往往擁有多副眼鏡,以適應不同的場景,如運動、辦公、旅行等。此外,眼鏡的類別也有很多,除了鏡架的款式非常豐富,滿足消費者對于美觀、時尚的追求外,鏡片的功能也多種多樣,如兒童離焦鏡、成人的緩解疲勞眼鏡,老人的全能花鏡,還有近視太陽鏡等。每個人實際上不止一副眼鏡,如果后面再加上一副智能眼鏡,我認為應用場景就更加廣泛了。
通常一個店鋪的SKU數(shù)量在800到1500之間,這取決于店鋪的大小,消費者進店的選擇性非常高。目前市場上新推出的智能眼鏡,由于仍處于起步階段,款式較少。但各廠家在硬件設計上做了許多改進,例如有的支持更換鏡腿等,我看到整個硬件設計也在不斷進步與創(chuàng)新。
實際上每個人的需求都不同,每副眼鏡都是獨一無二的定制產品,從鏡架到鏡片、屈光度、鼻托的高低、鏡腿的長短以及傾斜角等細節(jié)問題,這些差異使得眼鏡的定制變得復雜。并且,眼鏡用戶也會考慮到個性化需求,很難像其他標準形態(tài)的消費電子產品一樣,符合“二八定律”。如果十個人去吃飯,八個人都戴類似的眼鏡,他們恐怕是不愿意接受的。
關于價格,博士眼鏡劃分了幾個品牌,總統(tǒng)眼鏡價格往往在4000元以上,博士眼鏡體系的價格大約在八九百元,而石人工體系的價格則在三四百元左右。我們線上旗艦店也有各種促銷活動,價格范圍從一百多到三百多不等。這主要取決于用戶需求。鑒于中國市場巨大,且近視發(fā)病率極高,尤其在一線城市,大學生近視率都已接近90%,這樣一個龐大的群體實際上需求非常大。因此,我認為不應過分擔心價格問題。這次我們與雷鳥聯(lián)合推出的1799元的雷鳥V3實際上也已經受到了市場的廣泛歡迎。
對于人均配鏡數(shù)量,大部分視光消費者都擁有兩副以上眼鏡,尤其是對于那些度數(shù)超過300度的消費者來說,眼鏡幾乎成了他們身體的一部分。他們時刻離不開眼鏡,除了睡覺外,幾乎全天候佩戴。因此,擁有備用眼鏡是非常普遍的現(xiàn)象。
2024年雷鳥創(chuàng)新與博士眼鏡成立了新公司,圖源:網絡
案山子:對于目前屈光近視群體AI眼鏡有何解決方案?
李宏偉:由于我們的終端產品直接面向消費者,而且在產品開發(fā)的初期我們就考慮了這一因素。例如,不帶顯示的眼鏡只需將鏡片放入即可。范總提到,我們與博士眼鏡有深入的合作關系。用戶可以提供他們的近視度數(shù),我們可能在發(fā)貨時就將近視鏡片嵌入其中;他們也可以選擇在博士門店線下驗光配鏡,這主要取決于用戶的選擇。
對于帶顯示的產品,雷鳥在中長期戰(zhàn)略上都進行了不同的布局。短期內,我們會偏重ID上的優(yōu)化,例如將鏡片和波導貼合在一起,確保貼合效果足夠好,以至于用戶無法察覺到這是由兩片鏡片組成的。從長期來看,我們也在探索一些非常有潛力的新技術,旨在從技術層面上解決所謂的三片合一,即近視鏡片和波導鏡片的整合問題。另外,我們還在探討一些頗具前景的波導技術,它們可以實現(xiàn)屈光的即時調節(jié),但目前還處于概念階段。
案山子:今年AI眼鏡業(yè)務的增長情況如何?
石慶:這讓我想起了2010年平板電腦興起的時期,市場上的產品眾多,應用也十分廣泛。實際上,電腦、配件、互聯(lián)網、AI以及XR等眾多廠商都對此表現(xiàn)出了興趣。可以預見的是,這將是一個百花齊放的階段。然而,我相信并非每個公司都能成功開發(fā)這類產品,因為它涉及到每個人的審美差異,包括安全在內的多方面考量。
AI眼鏡在探索過程中,信心、決心和執(zhí)行力至關重要。以宏偉總為代表的團隊,執(zhí)行力尤為強勁,且處于快速發(fā)展的前列,在正確方向上較早出發(fā),使得他們可以快速取得成功。不過由于場景繁多,我認為其他企業(yè)在各自具備優(yōu)勢的細分賽道上,同樣存在諸多機遇。
范勤:我們從2021年開始關注和研究智能眼鏡,從2023年開始銷售智能眼鏡,已經陸續(xù)跟一些知名品牌達成合作,許多消費者通過走入我們的門店,對AI眼鏡也慢慢有了更多的了解。一直以來,博士眼鏡作為“智能眼鏡的最后一公里”,為消費者提供最好的驗配、體驗場景。他們之前可能在網上聽說過,但當他們真正體驗到這些智能眼鏡時,尤其是具備AI及光波導顯示功能的版本,許多消費者仍然感到驚訝。很多人是愿意購買和嘗試的。
另外一點,我了解到的是,現(xiàn)在也有人開始將AI眼鏡當成禮物。尤其現(xiàn)在臨近春節(jié),大家在考慮給親朋好友送點什么,消費者并不缺乏基本物品,但收到智能眼鏡這樣的禮物,許多人都會欣然接受,一口氣訂了幾臺的也大有人在。我覺得將智能眼鏡作為禮品市場也是廣闊的,不僅限于個人使用。
雷鳥V3,圖源:網絡
案山子:對于智能眼鏡的多SKU需求您是如何看待的?
李宏偉:不止眼鏡,這個時代實際上很多品類都存在多個SKU,衣服產業(yè)就是典型,我們見證了時尚、快時尚、超快時尚以及超超快時尚的市場發(fā)展過程。然而,電子消費品遵循的是不同的邏輯。我認為將這兩者相結合可能會產生有趣的結果。雷鳥也在嘗試此類結合,因為新產業(yè)或新方向的顛覆性實質上是整個價值網絡的顛覆性。從這個角度看,這似乎是一種成本,但從另一個角度來看,它可能是顛覆智能手機產業(yè)的一個潛在機會。
在設計SKU時,必須考慮到它作為裝飾品的時尚屬性,我們在設計眼鏡時已經進行了初步的分析。此外,我們考慮了一些基礎的方法來降低多SKU所導致的成本,雖然在前面添加攝像頭和顯示屏會增加復雜性,但仍有技術手段可以實現(xiàn)這一目標。雷鳥在這一過程中其實進行了大量的準備工作,可能后續(xù)會陸續(xù)向大家展示最終成果或放出相關產品。
另外我想補充一點,處理多個SKU也是一個需要平衡的問題。傳統(tǒng)眼鏡和電子消費品各有特點,而AI眼鏡最終結果很可能是處于兩者之間的中間狀態(tài),它既不像傳統(tǒng)眼鏡那樣SKU眾多,也不像電子產品那樣SKU較少。產品公司本身需要具備這樣的能力,即判斷什么樣的設計更可能吸引當前的目標用戶?,F(xiàn)在AI眼鏡的需求還沒有那么大,量還沒那么多。但從我們用戶調研的結果看,用戶喜歡什么樣的SKU,或者是說喜歡什么樣的ID設計,里面還是有跡可循的。
石慶:AI眼鏡多SKU需要考慮前期成本問題,以一個做工精良的模具為例,其成本通常在40萬-100萬之間。這還取決于所需的精細程度。如果品牌定位較高,成本可能還會更高。因此,攤銷到每一套產品中,定制費用是必須考慮的。包括電池、喇叭等組件都需要根據(jù)產品特色進行定制,這些都會增加成本。
不僅如此,軟件方面,包括喚醒詞、優(yōu)化算法、ESI、相機抖動、夜間降噪算法等,均可能影響最終成本??傮w而言,如果一年內的銷售額不足50K,將會非常令人沮喪。不過之前我們也提到,對于傳統(tǒng)眼鏡而言,單個款式達到50K已經是一個相當不錯的成績。
案山子:在面對客戶時,有沒有碰到一些比較特殊的需求,畢竟眼鏡屬于比較個性化的產品?
石慶:我們致力于尋找最大公約數(shù),關注共性所在。實際上,對于智能眼鏡鏡頭這一塊,你會發(fā)現(xiàn)其變化并不大。我們主要是在保持其共性的同時進行了一些改進。前框的多種變化和差異可以委托給我們的合作伙伴處理。我們專注于鏡頭組件的優(yōu)化,包括電池、喇叭、主板以及高密度排線等部件,通過改進彎折次數(shù)多的排線工藝,降低成本和提高良率,以匹配前面變化,從而確保產品上市時間和其他方面的穩(wěn)定性。這可能是優(yōu)化生產流程的第一步。
在大家經過12個月或18個月的深入思考和探索之后,我相信人們會更加專注于自己更為擅長的領域。我非常認同范總剛才提到的多元化經營的觀點。實際上,我聽說傳統(tǒng)眼鏡行業(yè)過去5萬臺的規(guī)模就已經是一個非常大的量級,這即便對于一些大公司來說,也是一個挑戰(zhàn),因為背后涉及到周轉、庫存、良率等問題。
對于功能, 我覺得AI眼鏡其實并不急于實現(xiàn)功能的最大化。首先應該設計出美觀、時尚、輕便和舒適的眼鏡。這是至關重要的第一步。隨后,我們可以逐步增加更多功能,讓大家在逐漸熟悉并接受這一品類的過程中,而不是一次性提供過多的信息。我們曾涉足MR市場,發(fā)現(xiàn)一個重大問題:普通消費者接受新事物的速度遠低于我們的預期,過于復雜的產品是不被他們所接納的。
我認為,在推廣過程中,大家應盡可能地在產品定義等方面逐步增加復雜性,給客戶一個適應的過程。不能因為客戶想要所有功能而不得不去創(chuàng)造需求。大家有時過于追求自身領域的獨特優(yōu)勢,但也要避免創(chuàng)造不必要的需求。
另外,我也想要補充一下,最近億境聯(lián)合博士眼鏡成立了一個AI眼鏡聯(lián)盟。我們的初衷是,這個聯(lián)盟里的各個會員單位能夠像以前深圳模式那樣,形成一個供應鏈集群。如果這個行業(yè)足夠成熟,大家都能很好地組織自己所擅長的業(yè)務的話,我堅信這將能夠為全球提供高效、快速且成本低廉的各種解決方案,最終是有可能打造對標Meta等大企業(yè)的好產品的,也希望能有更多的實力型會員單位加入進來。
億境虛擬CES展臺的AI眼鏡,圖源:網絡
案山子:AI眼鏡是一個系統(tǒng)性的工程,涉及相機調優(yōu)、定向傳音、芯片算法等,您覺得當前產品還有哪些值得提升的地方,背后如何實現(xiàn)?
李宏偉:我想從兩個層面進行討論。首先,盡管市場上已有很多產品,但許多產品的潛力尚未充分挖掘,無論是您提到的音頻、拍攝,或者是其他方面,都還有進一步改進的空間。因此,建議大家在這些方面投入更多精力。
比如石總剛才提的,如何在暗光環(huán)境下增強圖像,以及降噪技術如何實施,特別是在暗光條件下的降噪處理,仍然是一個挑戰(zhàn)。目前,由于眼鏡上的攝像頭硬件限制,其感光元件的尺寸不可能特別大。因此,對于不同公司而言,挖掘的潛力可能有所不同。哪怕Meta的攝像頭表現(xiàn)優(yōu)秀,也仍有進一步提升的空間。
類似的,還有Speaker(揚聲器),盡管現(xiàn)有的 Speaker 效果尚可,但其聲腔結構相對較小,這會影響在更大環(huán)境中的聽覺效果。對于那些做得比較頭部的企業(yè)以及表現(xiàn)比較好的公司來說,它們也在專注于定制化的工作。如果問我這些包含定制化組件的產品什么時候能出,我覺得今年底明年初應該會有比較ready的產品出來。
案山子:您如何看待大家趨近于Ray-Ban Meta的設計——AR1芯片+1200萬像素+4陣列麥克風?
李宏偉:根據(jù)目前市場上可選擇的方向,我們認為這是一個較好的搭配。判斷方法也相對直接和粗暴。Meta已經開發(fā)了兩代產品,我們可以粗暴地認為Meta已經盡可能選擇市場上最合適產品和組件,現(xiàn)在的產品是他們經過各種權衡之后的設計選擇。因此,從結果上來看,這也是一個較好的選擇,當然這也包括了AI的長期發(fā)展,因為使用某些芯片可能無法運行本地的優(yōu)秀AI功能。
案山子:您覺得在開發(fā)雷鳥V3的過程中主要難點都有哪些?
李宏偉:我認為,如果要讓AI在眼鏡上表現(xiàn)得出色,關鍵在于對大模型的接入和調用。簡而言之,直接將基礎大模型套到眼鏡上是不行的。為此我們與阿里合作進行了多項優(yōu)化。然而,工作遠未完成,包括增量訓練,我們需要對大模型本身進行修改,這是一個關鍵任務。在此過程中,我們發(fā)現(xiàn)還有許多提升空間。
除AI大模型外,在當前環(huán)境下,要調優(yōu)攝像頭并使其拍攝質量達到極致,仍是一項具有挑戰(zhàn)性的任務。如果與Pocket 3這種手持相機相比,AI眼鏡沒有云臺,防抖功能需要做得好難度會更高。另外,眼鏡硬件空間小,傳感器也會相對較小,而Pocket 3底部為一英寸的傳感器,難度要低得多。因此,優(yōu)化拍攝效果是一項持續(xù)的工作。
另外,拍照還有一些比較細化的東西,比如弱光、暗光、逆光、曝光傾向等,這實際上涉及多個維度的調整,包括硬件層面,如芯片ISP的性能是否足夠強大?攝像頭拍攝后預處理的程度如何?處理完之后,圖像視頻的優(yōu)化算法是否足夠先進?是否需要使用HDR技術,或者拍攝多張照片進行融合,以改善暗光環(huán)境下的圖像處理。這一系列問題本質上都涉及到投入的問題,即你是否認真對待和投入資源。
在這方面,我認為雷鳥確實有值得夸耀的地方,我們仍在持續(xù)優(yōu)化多個方面,同時也確實進行了較大的投入。舉個例子,眼鏡戴不正導致拍出來照片歪的問題,它幾乎必然會發(fā)生,因為沒有人的頭能夠保證是完全水平的。因此,我們開發(fā)了地平線矯正功能,將其融入算法中,這樣幾乎每次都會用到,它能自動調整照片并將其矯正至較為水平的狀態(tài)。
TCL本就擁有專門的Camera Lab,并投入了巨額資金,上億資金,用于整個系統(tǒng)的優(yōu)化。我們與頂級算法公司虹軟合作,一起給V3的影像系統(tǒng)做調優(yōu)。我們在此領域投入了巨大的努力,并持續(xù)進行改進。我們會定期對拍攝效果進行提升,加入藝術處理元素,并進行升級,以提供給用戶更好的體驗。
案山子:您對于AI眼鏡開發(fā)有何經驗看法?
石慶:AR1芯片的功耗并不會特別高,實際上它采用了4納米工藝,并且它是專為智能眼鏡設計的,集成了ISP等,目前市場上尚未見到其他專門為智能眼鏡設計的芯片,整體表現(xiàn)還是相當不錯的。正如剛才提到的,Ray-Ban Meta是一款在市場上已經經過驗證的產品。
雖然這款產品已經做得很優(yōu)秀,但我們仍能夠挖掘出不少的應用場景。舉例而言,為什么很多人都會傾向于選擇681攝像頭模組,原因在于它能夠支持一些端側DNN模型的拍照體驗。我們在展臺上首次展出一款設備,只要用戶比出“耶”的手勢或掃描二維碼,它就能執(zhí)行相應的動作。我認為這種交互方式比傳統(tǒng)的觸摸更加直觀和有趣。但這些設備需要能夠快速地做出反應,而不是將信息上傳到云端。正如我一直提到的Always On概念,這些還是要滿足的。
現(xiàn)在選擇索尼CMOS的比較多,原因有兩個:一是其經過驗證的可靠性,二是它支持端側DNN算法。盡管我們也有看到其他選擇,但這些選擇都包含一些未知因素,我們也和索尼方面進行了交流。我們首推681,因為它們將集中精力解決DNN端側的問題。目前,連Meta在這一塊都沒有完全調好,我認為這個眼鏡還有很大的改善空間。我們也將看到后面還有許多有趣的事情,就是主控芯片和端側sensor的打通配合。
此外,數(shù)據(jù)存儲和安全問題也非常重要。因為以前我們一直做MR,實質上一直是缺乏數(shù)據(jù)和內容的。但到了AI眼鏡,數(shù)據(jù)導出到手機可能會很快存滿,這就涉及到了存儲和安全問題。
無論是數(shù)據(jù)存儲本地還是上傳到云端,其中都蘊含著商機。我們?yōu)榇碎_發(fā)了NAS,用家庭計算中心以配合這一過程。眼鏡拍完后,照片可以立即上傳至NAS,并且很快就能在您家的智能相框上展示出來,比如你在美國拍的照片,你的家人或愛人立刻就能在中國的家中看到,這種體驗是非常強烈的。我認為,整個生態(tài)鏈的打通,或者說能夠有更好的APP的銜接,這些都是這個產品需要做的。
我認為,如果能夠理解市場需求,產品將得到市場的積極反響。其次,從設計和制造的角度來看,這確實需要堅定的投入,我認為不是隨便參與就能做好的。
就如同當初平板電腦市場的情況,看似機會眾多。當時有傳言說深圳有上千家企業(yè)都聲稱自己在生產平板電腦。但實際上,這些企業(yè)并非都生產整機產品,有的負責外殼材料的供應,有的專門制作喇叭,有的則專注于天線或排線的生產。如果各個領域有兩三家或三四家能夠嶄露頭角的企業(yè),那么在整合方面,就能挑選到一些性價比高且專注眼鏡行業(yè)的企業(yè),為行業(yè)提供服務,這也是我們非常期待的。
AI眼鏡爆款Ray-Ban Meta,圖源:網絡
案山子:在AI眼鏡的攝像頭調優(yōu)等方面,手機廠商是否具有先發(fā)優(yōu)勢?
石慶:手機廠商肯定有自己的優(yōu)勢。我們了解到一些手機廠商已經開始重視并投入資源開發(fā)這方面的技術。除了擁有深厚的供應鏈優(yōu)勢之外,他們甚至有些還有門店。此外,眼鏡短時間內還是離不開手機的,里面有一個銜接過程,他們在這個領域其實有著一定的天時地利。不過這是否就意味著他們能夠取得絕對優(yōu)勢呢?那也不一定。
實際上,新的領域總是孕育著新的機遇,否則這個世界格局將永遠不會改變,總是強者越強。我認為,這與他們的投入、人才的選取,以及投入的時機都有關系。也許他們晚了一步,或者錯過了某個關鍵時機。很多人都說,AI眼鏡未來會成為下一個計算平臺,那么手機廠商在這條賽道上也是在革自己的命。是否愿意自我革新也是頗具挑戰(zhàn)的問題。
李宏偉:手機廠商在拍照方面積累了很多技術,但是它并不能完全適用于AI眼鏡。手機拍攝組件的空間要求并不算苛刻,它能涉及多個攝像頭、光學變焦以及閃光燈,同時芯片能力也十分強大,我不清楚大家是否了解,手機上采用了各種激進的優(yōu)化方法,使用了強大的算力和拍照技術。
例如,通過拍攝多幀照片進行降噪處理,可以有效降低噪聲水平。因為多幀圖片中噪聲的出現(xiàn)情況各不相同,某些元素在圖片中方向略有差異。因此,在優(yōu)化算法時,針對眼鏡和手機的拍攝優(yōu)化方向有所不同。雖然過去的經驗有一定幫助,但也不能完全照搬。
案山子:如何看待Always On導致的隱私與功耗問題?
李宏偉:實際上,數(shù)據(jù)收集的鏈路本身是可行的,只要你想收集數(shù)據(jù),就可以進行收集。這里暫時不考慮隱私問題,它的鏈路本身是通暢的。至于設備本身的限制,例如Always On對功耗的限制,這些問題也有技術方法可以解決。我們很多技術研究,需要確定哪些場景確實需要持續(xù)收集數(shù)據(jù),這不僅對技術有要求,也對用戶和場景的洞察至關重要。這是首要問題。
隱私問題在某種程度上是一個底線問題。我們有一個底線要求,產品至少要符合這個要求。隨著時代的發(fā)展,底線要求可能會發(fā)生變化。以手機相機為例,過去很多國家要求手機拍照都需要發(fā)出聲音,而現(xiàn)在只有日韓還有這樣的法定要求,這是社會習慣和接受度提高的結果。我相信,未來在AI眼鏡方面也會出現(xiàn)類似情況,符合當下的要求就行。目前雷鳥的做法是產品配備一個閃光指示燈,在拍攝時會提醒用戶,類似于過去手機在拍照要求嚴格時的做法。
當然,對于隱私問題,我們也在進行一些設計探索,使得它在這方面能更優(yōu)雅一點。比如說可以在攝像頭前面加一些遮擋,從而減輕人們在某些場合的社交焦慮,我們正在研究這些設計,后面不排除會推出類似的配件。
石慶:隱私問題實際上可以分為兩部分:個人隱私和他人隱私。其中他人隱私比較顯性,西方很多國家對這一問題在持續(xù)關注。我認為確實需要一個指導部門,未來有行業(yè)協(xié)會介入,在隱私保護方面制定一些行業(yè)規(guī)則,如拍照閃爍等,實際上這也是我們成立AI眼鏡聯(lián)盟的初衷之一。不過目前AI眼鏡所涉及的量還不算太大,我覺得我們目前應該先繼續(xù)前行,不必過于糾結。
關于個人隱私問題,我們經常討論和分析,大家的數(shù)據(jù)可能不適合上傳至云端,而更適于存儲在個人手機、電腦或家庭服務器上。總之,能夠在邊緣側進行存儲。而且,隨著未來AI眼鏡使用頻率的增加,數(shù)據(jù)量也將顯著增大。因為后面涉及到AI對你的理解問題,它需要長期大量保存數(shù)據(jù)。AI收集數(shù)據(jù),其實也是一個自己認知的積累過程,甚至在年老時,人們反過來需要依賴年輕時的數(shù)據(jù)來支持決策,這是一件頗具意義的事。因此,我認為一個較好的解決方案是找到方法將你和家庭的數(shù)據(jù)都存儲在本地。這可能需要準備幾十個T的存儲空間來容納我們多年積累的數(shù)據(jù)。
雷鳥V3展示的AI玩法,圖源:網絡
案山子:關于AI眼鏡的云端模型與端側模型的探討?
李宏偉:當前眼鏡的AI應用場景主要體現(xiàn)在兩個方面:一是對話與問答,如語音搜索,這是使用頻率較高的。二是視覺識別,這主要包括兩個任務,其一是翻譯,例如識別圖片中的文字;其二是學習,比如識別公園樹上的黃色花朵和葉子,還有其他未知的事物。如果再接下來,可能它將會成為一個智能的個人助理,這個智能助理擁有第一視角能力,未來能夠執(zhí)行諸多任務,如日程安排,像一個助理一樣通過對話幫你規(guī)劃一系列行程的解決方案。這是在工具層面的應用。此外,在情感陪伴方面,AI也能提供支持。
關于端側和云側的問題,端側模型當然在快速發(fā)展,但短期內,前面提到的眼鏡場景還是以云端AI為主。事實上,目前即便是在手機和PC上面,端側模型的表現(xiàn)也并不足夠理想?,F(xiàn)階段,眼鏡上的端側模型主要是一些服務基礎功能的小模型,比如特定語音指令模型、翻譯模型等,這背后的選擇取舍關鍵在于產品體驗和用戶需求。
另外,也有人認為AI眼鏡可以調用手機算力以減少對云端的需求,但我認為手機和PC端側的能力尚未充分發(fā)展,至少目前還不是很成熟。其次,如果要連接手機獲取手機端的能力,就需要明確哪些場景比云端效果更好、速度更快,目前我看到的用例并不多,如果云端有一個優(yōu)秀的模型,為什么還需要在端側進行呢?當然了,這仍是一個值得探索的方向,雷鳥也在與高通合作研究這一方向,并在高通峰會上展示過相關成果。
石慶:目前的情況是,由于多種原因,端側的效果還不是特別好??赡苡幸粋€過程,但是它已經可以跑一些小模型,比如在Sensor上的DNN,其實它反應是最快的,但目前存在一些功耗等方面原因。AI眼鏡與手機配合也是一個值得探索的方向,如今的智能手機大多具備AI功能,其算力往往超過15T,能夠執(zhí)行一些基本任務。但總體而言,目前看來,云端處理仍然是主流,而且云端服務的效果也相當不錯。端側目前的迫切性不是很高。
我再補充一點,我們經常會談到云邊端,未來端側算法可能會應用于手機、平板等設備,而邊側我們預計,它可能會被部署在中小企業(yè)或家庭環(huán)境中,供多人共享其計算能力。無論是以家庭還是小企業(yè)為單位,讓其同時承擔存儲和計算任務,實際上可以完成許多工作,由于這類設備通常會長時間通電,因此其計算能力和穩(wěn)定性是有保障的。
案山子:關于AI眼鏡操作系統(tǒng)的問題?
石慶:因為我們做過VR和MR項目,之前一直沒有一個統(tǒng)一的操作系統(tǒng),也缺乏背后的內容生態(tài),我們也是走了很長一段時間很艱難的路。產品要么成為游戲機,要么就成為視頻播放器,這個局面確實比較尷尬。
因此,我們一直密切關注生態(tài)系統(tǒng)這一塊的發(fā)展,如果谷歌在2024年12月中旬發(fā)布的Android XR能夠解決這些問題,那將是一個非常積極的信號。這將使得硬件或品牌企業(yè)不僅在國內,也將有機會接觸海外項目。特別到了后期,眼鏡接入顯示,背后更依賴于這么一個生態(tài)系統(tǒng),我們對這一領域未來充滿信心。
李宏偉:首先,從長遠來看,我們肯定會與操作系統(tǒng)(OS)合作。操作系統(tǒng)不僅涉及技術問題,更關乎生態(tài),這包括開發(fā)者的兼容性以及硬件芯片的兼容性。因此,操作系統(tǒng)通常需要保持一定的統(tǒng)一性?;诖?,我們傾向于與行業(yè)領先的OS公司建立合作關系。
其次,在操作系統(tǒng)準備好之前,我們確實需要發(fā)布產品,我們不會在操作系統(tǒng)本身中投入過多的資源,但會專注于為用戶提供優(yōu)質的第一方應用,比如翻譯、拍攝、音樂等,目前這些應用都是雷鳥自己做的,我們在這些應用上面花了很多的力氣。
第三,對于開發(fā)者平臺而言,時間也是一個關鍵因素。如果在后期有一個比較通用的OS,那么這個OS自然會在開發(fā)者平臺上推出。但在那之前,我們仍需完成一些重要的工作,所以雷鳥也有自己的開發(fā)者平臺,目前全球已有上千名開發(fā)者在為我們開發(fā)應用。即便未來市場出現(xiàn)了通用型的OS,但我們也會推出一些個性化的SDK,因為我們還有比較領先的硬件和底層軟件的功能。
案山子:今天的分享就到這里,感謝大家的參與,再見。
投稿/爆料:tougao@youxituoluo.com
稿件/商務合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產業(yè)服務平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息