Eternal sunshine and the spotless mind – 永恒陽(yáng)光下的潔凈心靈
本文系投稿,作者:費(fèi)越 博士
對(duì)Vision Pro的總體看法
Apple Vision Pro發(fā)布會(huì)后很多人的興奮程度不亞于2007年人們看完iPhone 1代發(fā)布會(huì)后的興奮程度??偟膩碚f,Apple Vision Pro是一個(gè)非常非常蘋果風(fēng)格的產(chǎn)品。Vision Pro和其它XR頭顯所強(qiáng)調(diào)的東西完全不同:并沒有強(qiáng)調(diào)沉浸式游戲,而是和蘋果歷史以來一貫所強(qiáng)調(diào)東西高度一致:那就是面向普通消費(fèi)者,面向普通人。
因?yàn)锳pple Vision Pro發(fā)布會(huì)上所強(qiáng)調(diào)的核心應(yīng)用,給用戶的核心價(jià)值有3個(gè):1. Entertainment – 影音娛樂, 2. Socializing – 社交通訊,3. Productivity – 兼容大量已有的2D應(yīng)用。
如果對(duì)比2007年iPhone 1代的發(fā)布,會(huì)發(fā)現(xiàn)驚人的類似。iPhone的3個(gè)核心價(jià)值主張是一摸一樣的:1. iPod - 影音,2. Phone/Face Time - 通訊,3. Internet Browser - 兼容大量已有的應(yīng)用 (在2007年的時(shí)候還沒有App概念。一個(gè)一個(gè)的網(wǎng)站,比如Amazon, Facebook, 微博, 就是一個(gè)一個(gè)應(yīng)用)。
所以,Vision Pro和iPhone 1發(fā)布會(huì)上的核心應(yīng)用是一模一樣的3個(gè):
并且保持了蘋果一貫的發(fā)布會(huì)上事不過三的原則,消費(fèi)者的大腦無法記住超過3個(gè)重點(diǎn)。
除了上面3個(gè)核心賣點(diǎn),Vision Pro和iPhone發(fā)布會(huì)上提及的第二級(jí)附屬功能也是驚人的完全一致:1. 為此新平臺(tái)專門開發(fā)的新應(yīng)用, 2. 拍照和看照片(內(nèi)容生產(chǎn),UGC)
1.為此新平臺(tái)專門開發(fā)的新應(yīng)用。iPhone 1 對(duì)比 Vision Pro:
2. 拍照和看照片(內(nèi)容生產(chǎn),UGC):
把AVP發(fā)布會(huì)上對(duì)產(chǎn)品的所有價(jià)值主張和iPhone一代發(fā)布會(huì)做個(gè)對(duì)比:
它們是一模一樣的。由此可見蘋果對(duì)消費(fèi)者核心需求的理解和實(shí)操保持了相當(dāng)強(qiáng)的一貫性和一致性。因?yàn)槠胀ㄈ耸瞧胀ǖ纳罘绞健H藗兿M軌蜉p松快樂地:娛樂,工作,溝通,創(chuàng)作。
蘋果這次很踏實(shí),并沒有標(biāo)新立異的對(duì)一個(gè)新硬件創(chuàng)造出一套新奇的需求體系。這是由于蘋果對(duì)消費(fèi)者最重要的,最本質(zhì)需求的深刻理解:消費(fèi)者是同樣的消費(fèi)者,不要試圖用花活把消費(fèi)者改造成適應(yīng)新技術(shù)的新人,而是要讓技術(shù)適應(yīng)人。
有人這樣類比:之前的VR頭顯的設(shè)計(jì)是滿足一群奇怪的人 “能那種家里來了客人正在聊天,他自己卻鎖起門來玩10個(gè)小時(shí)游戲的那種怪人” , 而Vision Pro滿足的你我他,所有正常人。
VR從游戲機(jī)開始?
過去的幾年大部分VR公司都把產(chǎn)品形態(tài)收斂為游戲機(jī),包括HTC、Oculus等。
這并沒有錯(cuò),因?yàn)閂R的技術(shù)水平和體驗(yàn)只能滿足游戲機(jī)的用戶體驗(yàn)要求。
這和個(gè)人電腦發(fā)展歷史非常相似:當(dāng)電腦進(jìn)入2C市場(chǎng)的時(shí)候,首先被做成的也是游戲機(jī),1972年Atari,而2C的個(gè)人電腦形態(tài)1977年才出現(xiàn),Apple II。
隨身的移動(dòng)電腦的發(fā)展也類似,首先出現(xiàn)的產(chǎn)品也是游戲機(jī):2004年的PSP (PlayStation Portable), 同年Nokia發(fā)布了游戲機(jī)手機(jī)N-Gage(不知道有多少人記得),2005年的Nintendo DS。
2007年才出現(xiàn)的通用型的移動(dòng)計(jì)算機(jī):iPhone。
所以在技術(shù)水平達(dá)不到成為2C計(jì)算機(jī)形態(tài)的時(shí)候,往往首先能夠滿足游戲機(jī)形態(tài)。那么就先做游戲機(jī)是合理的選擇,能夠做出成功的產(chǎn)品,比如Oculus Quest 2。
· 為什么其它VR頭顯都是主攻游戲,而蘋果并沒有做游戲機(jī)?
因?yàn)樘O果是一個(gè)2大C的公司,想要做新的計(jì)算平臺(tái)服務(wù)大眾消費(fèi)者。本質(zhì)問題是:能否先做游戲機(jī),然后過度和升級(jí)成為計(jì)算平臺(tái)型的產(chǎn)品?
從歷史中看,做出了成功游戲機(jī)品的公司都并沒有轉(zhuǎn)化為做通用形計(jì)算機(jī)。比如Atari,Nintendo FC,SONY PlayStation… 以游戲做為出發(fā)點(diǎn)的設(shè)備并沒有在未來成功演化為通用消費(fèi)設(shè)備。
我認(rèn)為VR也是這樣,游戲機(jī)雖然從歷史和市場(chǎng)角度是個(gè)好產(chǎn)品,但無法以此為基點(diǎn)演化為通用消費(fèi)設(shè)備。因?yàn)樵O(shè)計(jì)一個(gè)通用消費(fèi)設(shè)備需要全身心的投入,design from ground up,不做任何妥協(xié) 。就像油改電是無法做出好的電動(dòng)車。做通用型計(jì)算平臺(tái)比做游戲機(jī)更難,更需要時(shí)間和耐心,但回報(bào)也是巨大的。
其本質(zhì)原因是什么?不知道??赡艿脑蚴牵阂鲆粋€(gè)成功產(chǎn)品,其組織管理,團(tuán)隊(duì)成員的能力,和文化一定是高度的適合這個(gè)產(chǎn)品。原因是,成功是極為困難的,成功的產(chǎn)品需要團(tuán)隊(duì)100%的投入和專業(yè)化。產(chǎn)品和團(tuán)隊(duì)是相互打造的,一個(gè)產(chǎn)品是公司人員,管理,文化的直接映像。同樣的團(tuán)隊(duì)再開發(fā)一個(gè)完全不同類型的產(chǎn)品,團(tuán)隊(duì)的意愿很小,能成功的可能性很小。
有個(gè)說法是,對(duì)于創(chuàng)業(yè)團(tuán)隊(duì) “you can pivot, but you can‘t hedge” :如果發(fā)現(xiàn)產(chǎn)品或商業(yè)模式的方向不對(duì),那么全員轉(zhuǎn)向新的產(chǎn)品和商業(yè)模式并100%的投入進(jìn)去,是可以的;但絕不能腳踩兩只船,同時(shí)平行做多個(gè)不同的東西投機(jī)。
Facebook的Oculus團(tuán)隊(duì)原本是個(gè)很純粹的游戲團(tuán)隊(duì),對(duì)于如何游戲化的設(shè)計(jì)整個(gè)硬件軟件產(chǎn)品有豐富經(jīng)驗(yàn)。Quest 1,2是專注而成功的。但Facebook的野心不滿于此。后來混入了做互聯(lián)網(wǎng)的人,和來自蘋果的做2C消費(fèi)電子產(chǎn)品經(jīng)驗(yàn)豐富的人,其產(chǎn)生的Quest Pro是一個(gè)四不像產(chǎn)品。
為什么蘋果Vision Pro這么重視VST?
蘋果把VST的質(zhì)量放在產(chǎn)品中非常高的優(yōu)先級(jí)。在2018年就收購(gòu)了做VST頭顯的公司VRVana (頭顯產(chǎn)品Totem)。
因?yàn)樘O果對(duì)用戶有比其它廠家更加深刻的洞察力。對(duì)于“VR難以被大眾接受的最大原因是什么?”這個(gè)問題,通常的回答列表會(huì)是:
這些實(shí)際上都是錯(cuò)誤答案。真正最重要的原因是:看不見真實(shí)世界的VR模式是和人類(任何動(dòng)物)億年進(jìn)化出來的生物本能相矛盾的。用戶心里永遠(yuǎn)會(huì)有不安全感,隱藏在內(nèi)心深處。
uSens和VRVana都是在~2016年的時(shí)候把雙目RGB相機(jī)VST定義到了2C的頭顯上,是世界上最早定義VST頭顯中的。因?yàn)楫?dāng)時(shí)同樣認(rèn)識(shí)到了VR的最大問題在哪里,并且認(rèn)識(shí)到了VST能夠開啟的AR大門,實(shí)現(xiàn)讓人獲得把不可能變?yōu)榭赡艿某耗芰Α?/p>
uSens的Impression Pi頭顯配置更接近Vision Pro:
蘋果不做用戶問卷,不請(qǐng)外部專家來做評(píng)審,因?yàn)樽钪匾脑蛲[藏在用戶心里,用戶自己都不知道,知道也會(huì)掩飾不說。所以這是靠問卷訪談得不到的。
蘋果的洞察能力明顯優(yōu)于其它公司,不光從VST硬件和性能上的投入力度,從2個(gè)方面也能看出來:
尤其是第二點(diǎn)。因?yàn)樘O果洞察到,哪些東西是用戶一定要感覺自己有100%把控能力的。這些東西,如果用戶不能100%把控,內(nèi)心就會(huì)有極強(qiáng)的不安全感,那么產(chǎn)品就會(huì)出大問題。
VST就是這種用戶從心理層面必須覺得自己有100%成功率的立即控制能力的, 否則用戶就會(huì)產(chǎn)生極大不安全感。這種不安全感就是VR的最大障礙。所以加了硬件按鈕。
就像手機(jī)的靜音物理開關(guān),Android手機(jī)都去掉了這個(gè)開關(guān),而iPhone至今還保留了這個(gè)物理開關(guān)。蘋果第一個(gè)摒棄了物理耳機(jī)插孔,但最后一個(gè)去掉靜音開關(guān)。因?yàn)樘O果不是靠復(fù)雜的功能和能力,而是重視人的心理狀態(tài)。
Apple Vision Pro和Meta等公司頭顯的核心區(qū)別是什么?
有人開玩笑,說VR, AR設(shè)備是占領(lǐng)用戶的臉 ,簡(jiǎn)直就像 Alien vs. Predator
蘋果不提XR/MR/VR,回避了產(chǎn)品是不是“占據(jù)用戶的臉”。Vision Pro這個(gè)產(chǎn)品的真正意義是:
Vision Pro這個(gè)硬件產(chǎn)品只是一個(gè)表象而已,這個(gè)產(chǎn)品實(shí)際上并不算完美,它不是蘋果的目的,未來肯定會(huì)進(jìn)一步演化。要看的是實(shí)物的本質(zhì):蘋果的核心演進(jìn)方向是 1. 占領(lǐng)用戶的視覺,2. 占領(lǐng)整個(gè)空間世界, 3. 占領(lǐng)時(shí)間。
Vision這個(gè)名字取的不錯(cuò),它實(shí)際上蘊(yùn)含有幾個(gè)意思:1)圖像,視覺效果;2)視野,眼界;3)想象力,對(duì)未來的前瞻性;4)幻象,夢(mèng)幻。所以,是個(gè)很好的產(chǎn)品名。
蘋果把產(chǎn)品名定為Vision,把品類名定為Spatial Computing Device : 空間計(jì)算機(jī)。
蘋果抓住的是1)人性化,人的感受和需求, 2)對(duì)未來的深刻理解。這是蘋果和Meta等公司的最大區(qū)別。
其3D拍,3D看,就像電影《Eternal Sunshine of the Spotless Mind》中講述的:“如果可以忘記,如果已經(jīng)不能不忘,我仍不甘心,要將你藏在記憶的最深處,在必須遺忘的最后一刻,還要留下再次相見的暗語(yǔ)。”
uSens在2015~2018年也定義和研發(fā)了頭顯產(chǎn)品:Impression Pi。它的設(shè)計(jì)和定位與Apple Vision Pro非常類似。
對(duì)產(chǎn)品的命名,品類的命名方式也和蘋果類似。uSens 把產(chǎn)品名定為Impression,把品類名定為Super Reality Device(超現(xiàn)實(shí)計(jì)算機(jī))。Impress一詞和Vision很類似,深層的意思是:1)外觀,畫面,視覺感受;2)和印象派畫的本質(zhì)一樣,重要的是捕捉稍縱即逝的環(huán)境,創(chuàng)建深度、運(yùn)動(dòng)的感覺;3)一種印象,感受,和情感,一種內(nèi)心深處的記憶和表達(dá),而不是表面的圖像而已。一個(gè)好的產(chǎn)品,從內(nèi)到外應(yīng)該是一個(gè)藝術(shù)品,給人帶來的是情感,就像印象派畫一樣。
蘋果和uSens的共同點(diǎn)是,認(rèn)為這個(gè)新產(chǎn)品的本質(zhì)是:
· Apple 和 Google 的區(qū)別是什么?
兩家公司在文化上有本質(zhì)性的巨大區(qū)別。從一個(gè)簡(jiǎn)單的例子就能看出,兩家公司在AR方面都有多年的算法和應(yīng)用生態(tài)的布局,Apple做了ARKit(ARKit也是Vison Pro產(chǎn)品里的核心視覺算法之一),Google做了對(duì)應(yīng)的ARCore。
Apple對(duì)ARKit的概括語(yǔ)是: “Change the way you see the world, Realistic and immersive experience.” – 改變你看這個(gè)世界的方式,達(dá)到真實(shí)和沉浸的體驗(yàn)。
Google 對(duì)ARCore的概括語(yǔ)是 : “Make Physical world acquire Digital attributes, Make the world your digital canvas.” – 讓物理世界獲得數(shù)字屬性,讓世界成為你的畫板。
能看出來,蘋果只講人,只講體驗(yàn)。Google只講物,只講功能。這就是兩家公司在文化上的本質(zhì)區(qū)別。蘋果是體驗(yàn)第一,藝術(shù)第一,完美第一。Google是功能第一,而體驗(yàn)和藝術(shù)感完全沒有,所有東西都像兒童的卡通玩具。
當(dāng)時(shí)uSens也對(duì)其產(chǎn)品和公司目標(biāo)的概括語(yǔ)是:“Realize your dreams, make impossible possible. Make the digital world as real as possible, and close the gap between the two.” “讓你實(shí)現(xiàn)夢(mèng)想,把不可能變?yōu)榭赡堋W寯?shù)字世界和物理世界一樣的真實(shí),并且讓兩者融為一體。” 這個(gè)文化和蘋果的更接近一些。
但是要注意到,上面三種對(duì)XR目標(biāo)的描述都有重大缺陷:都沒說出來這個(gè)東西有什么用?講體驗(yàn)也好,講功能也好,都是空洞的。對(duì)用戶來說到底有什么用處,解決什么問題?誰(shuí)都沒說清楚,因?yàn)檎l(shuí)都沒想清楚。這是XR的最大問題。它很酷,但它有用么?
· 改變?nèi)说纳罘绞? / Changing people’s Lifestyle 可以讓一個(gè)新設(shè)備成立
實(shí)際上蘋果對(duì)于一個(gè)新設(shè)備成不成立的評(píng)判標(biāo)準(zhǔn)是:這個(gè)設(shè)備是否能改變?nèi)说纳罘绞?(Change people’s Lifestyle)。如果能夠給用戶一個(gè)某些場(chǎng)景下更好,更舒適愉悅高效的生活方式,那么這個(gè)新產(chǎn)品就是成立的。
比如iPad,它對(duì)比iPhone沒有任何新功能。但是它能滿足一個(gè)新的生活方式:
Apple Vision Pro也是一樣,能夠在某些情景下讓用戶可以放松,安逸,享受,沉浸。這是現(xiàn)在任何一個(gè)設(shè)備都無法給人的生活方式。
· 創(chuàng)新點(diǎn):3D大自然環(huán)境,多應(yīng)用在3D空間中排布
這個(gè)設(shè)計(jì),2004年Sun Microsystem和我的創(chuàng)業(yè)公司Infinite 3D同時(shí)提出和實(shí)現(xiàn)了,release了beta版。這兩個(gè)產(chǎn)品的目的是實(shí)驗(yàn),實(shí)驗(yàn)消費(fèi)者的反應(yīng)。Sun的系統(tǒng),可以把Sun OS變?yōu)?D OS,所有已有2D應(yīng)用都兼容。Infinite 3D系統(tǒng)把Windows變?yōu)?D OS,兼容所有已有2D應(yīng)用。并且?guī)в?)環(huán)視的3D大自然環(huán)境,2)也可以一起運(yùn)行遠(yuǎn)程其它計(jì)算機(jī)上的應(yīng)用,3)新的3D app的framework, 3D UI。當(dāng)時(shí)這個(gè)系統(tǒng),就是為了未來在真正的XR頭顯上運(yùn)行的。當(dāng)時(shí)選用的環(huán)視3D自然環(huán)境是祖國(guó)自豪的珠穆朗瑪峰頂。
Sun Microsystem - Looking Glass
Infinite 3D
3D Launcher的設(shè)計(jì),后來也出現(xiàn)在了2008年的Mac OS上:
這種空間計(jì)算,3D UI給用戶帶來的好處是:
那為什么沒有把它放到uSens的頭顯和后來做的其它頭顯里?因?yàn)轭^顯的分辨率一直不夠高,無法讓用戶達(dá)到這個(gè)產(chǎn)品功能所宣稱的要給用戶帶來的好處, 那么就不要上線這個(gè)功能。
而蘋果Vision Pro的分辨率領(lǐng)先其它產(chǎn)品首先達(dá)到了足夠的高度,終于可以讓用戶滿意的得到我們所宣稱的東西了。
如果對(duì)用戶做了一個(gè)promise:這個(gè)產(chǎn)品功能有多好,有多么有用, 那么產(chǎn)品一定要deliver the promise,否則就不要上線這功能。如果欺騙用戶,就是欺騙自己,產(chǎn)品一定會(huì)吃灰。不要抱僥幸心理。
手眼交互為什么這么神奇
1. 眼睛的運(yùn)動(dòng)比手更快,更準(zhǔn)。
視覺信息占大腦處理信息的80%,所以眼睛的轉(zhuǎn)動(dòng)速度,精度,延遲對(duì)生存來說極為重要,眼睛也是距離大腦最近的器官。物理上講,控制眼睛轉(zhuǎn)動(dòng)的肌肉和手臂連桿結(jié)構(gòu)相比簡(jiǎn)單直接得多,轉(zhuǎn)動(dòng)慣量也小,所以和眼睛比手的尋址運(yùn)動(dòng)快得多。
并且眼睛是心靈的窗口,任何細(xì)微的思緒往往難以逃過在眼睛上的反映,更進(jìn)一步的挖掘眼睛的圖像可以做到對(duì)大腦思想的分析。
觸摸屏交互:從大腦下達(dá)了命令到手運(yùn)動(dòng)到了目標(biāo)位置有100ms以上的延遲,而觸摸屏本身再加~80ms的延遲。而眼睛本身響應(yīng)大腦的命令到運(yùn)動(dòng)到目標(biāo)只有~50ms延遲,眼動(dòng)系統(tǒng)~15ms延遲,遠(yuǎn)快于手部交互。
2. 因?yàn)檠劬Φ倪\(yùn)動(dòng)并不是用戶的額外負(fù)擔(dān)。
不管你用什么其它的交互方式,不管是鼠標(biāo),觸摸屏,還是手勢(shì), 實(shí)際上你的眼睛反正都要先去看你想點(diǎn)擊的UI控件, 然后再移動(dòng)手。
手的動(dòng)作是人要額外努力去做的動(dòng)作,不是必須的行為;而眼睛的動(dòng)作不是額外的,是下意識(shí)里就已經(jīng)完成了。所以,用戶從習(xí)慣了用手交互轉(zhuǎn)到用眼手結(jié)合,會(huì)有前所未有的讀心術(shù)的感受:“這個(gè)系統(tǒng)怎么會(huì)這么快?大腦想什么就能立刻實(shí)現(xiàn)什么?”。
實(shí)際上不是眼睛太神奇,而是手太慢。我們?cè)攘?xí)慣適應(yīng)了非常緩慢的手部尋址交互,而不覺得它慢。所以,這也印證了蘋果經(jīng)常說的:不要搞用戶調(diào)研,不要問用戶他有什么痛點(diǎn),因?yàn)橛脩粢呀?jīng)麻痹了。必須把新東西做好了,擺在用戶面前,用戶才會(huì)明白。
這個(gè)手眼交互方式和軟硬件系統(tǒng),2011年我在硅谷的松下研究中心(位置就在現(xiàn)在蘋果總部旁邊200米的地方)就已經(jīng)實(shí)現(xiàn)了。并發(fā)現(xiàn)了這種手眼結(jié)合交互的神奇感受,這是最佳的交互方式。
當(dāng)時(shí)眼動(dòng)系統(tǒng)采用了Tobii和SMI的方案。后來Tobii于2014年上市,而2017年SMI被蘋果收購(gòu),支撐了蘋果的Vision Pro產(chǎn)品。
既然,手眼結(jié)合的交互不是新鮮事,為什么在其它頭顯沒有采用?
1. 松下的模式是: 把研究結(jié)果放到“保險(xiǎn)箱”里,等未來有客戶有需求了就拿出來。但客戶不懂人機(jī)交互,怎么知道自己有這個(gè)需求呢?但至少松下有專利保護(hù),也不算白做了研究。
2. 這個(gè)交互方式的優(yōu)秀性也有不少人直接憑空就能想到。比如國(guó)內(nèi)造車新勢(shì)力中的一家,2019年的時(shí)候其創(chuàng)始人就直接想到了在汽車中使用這個(gè)交互方式,并希望uSens能幫助其實(shí)現(xiàn)。對(duì)他的感悟力我感到欽佩。但需要眼動(dòng)達(dá)到極高的精度和靈敏度,會(huì)讓公司在投入的資金,和時(shí)間需要的等待方面望而卻步。因?yàn)檫@是一個(gè)長(zhǎng)期的,并需要冒險(xiǎn)進(jìn)行領(lǐng)先整個(gè)業(yè)界的投入,而不是簡(jiǎn)單購(gòu)買一些模塊拼湊出來。
3. 而蘋果,收購(gòu)了SMI之后能夠內(nèi)部和硬件,光學(xué),傳感器和算法等多部門合作,做垂直的整體優(yōu)化。所以能夠達(dá)到足夠的精度滿足產(chǎn)品需要。這就是下面要說的,蘋果 “不做拼湊式創(chuàng)新”,因?yàn)檫@是不可能的。
4. 其它VR公司在做“游戲機(jī)”方向,所以成本控制極為嚴(yán)格。并且6DoF手柄和沉浸式游戲進(jìn)行交互是重點(diǎn)問題,如何和UI改進(jìn)交互不是重點(diǎn)要解決的問題。手-眼 交互方式不是萬能的,并不適合沉浸式6DoF游戲
· 蘋果的手勢(shì)交互為什么這么好
蘋果采用了紅外相機(jī)并帶有紅外補(bǔ)光,這樣圖像的質(zhì)量和穩(wěn)定性更高,可以達(dá)到更魯棒更精確的手勢(shì)識(shí)別效果。
而這個(gè)硬件方案Leap Motion和uSens在~2013年就發(fā)明,并在~2018年通過深度學(xué)習(xí)的算法達(dá)到了非常好的產(chǎn)品級(jí)效果。
但現(xiàn)在的其它頭顯為什么都沒有采用?比如,HTC Cosmos等用的是VST的雙目RGB相機(jī),Quest 2和Pro用的是SLAM的灰度相機(jī)。因?yàn)檫@些頭顯都在拼游戲機(jī)市場(chǎng),陷入了成本內(nèi)卷,為了最低的成本,讓手勢(shì)成為二等公民,復(fù)用專門為其他目的而已經(jīng)放在了產(chǎn)品上的相機(jī)。
蘋果追求極致的手勢(shì)效果,所以采用了這個(gè)方案。說明產(chǎn)品經(jīng)理,和上下全鏈路整合優(yōu)化起到了關(guān)鍵作用。和眼動(dòng)一樣,特殊的硬件,加上算法,才能達(dá)到神奇的效果。
說個(gè)題外故事,2013年Leap Motion去硅谷某家大公司談合作,大公司里的人對(duì)其嗤之以鼻:“你們只是兩三個(gè)毛孩子而已, 我們有幾百個(gè)算法方面的專家博士,你們的手勢(shì)效果不過是騙人的障眼法而已,我們分分鐘就能做出來。”
2016年uSens參加一個(gè)專家評(píng)審,當(dāng)時(shí)uSens已經(jīng)能夠在高通800移動(dòng)芯片上實(shí)時(shí)50fps運(yùn)行,并且能夠處理各種3D自然手勢(shì)。專家也是很資深做得領(lǐng)先的大學(xué)教授,說:“你們是騙人的,我們最先進(jìn)的學(xué)術(shù)狀態(tài)也需要在臺(tái)式機(jī)Nvidia的GPU上才能跑個(gè)30fps,而且無法覆蓋各種自然手勢(shì)。你們就是騙錢的,都是假的。”
為什么Leap和uSens能夠做到別人不能相信的東西, 原因和蘋果一樣:產(chǎn)品思維。需要從相機(jī)硬件,到算法,到執(zhí)行器做垂直的全鏈路優(yōu)化,和全鏈路創(chuàng)新。比如,使用紅外照明:讓困難的手勢(shì)識(shí)別任務(wù)變得簡(jiǎn)單而且更精確,用巧妙的方法獲得優(yōu)勢(shì),而不是只憑在模型上下蠻力。
Leap的CTO David Holtz后來做了Midjourney,也是一樣,其效果令人驚嘆“簡(jiǎn)直是不可能的”。他是如何做到的我想應(yīng)該一樣,創(chuàng)新:用各種巧妙的方式解決問題,而不光是蠻力。
蘋果的員工對(duì)蘋果的評(píng)價(jià)是喜憂參半:蘋果的產(chǎn)品能力非常強(qiáng)。但蘋果在research(前沿的科研)方面薄弱,和Google, Meta相比差很多。這個(gè)評(píng)價(jià)是中肯的。
蘋果的核心到底是什么?和其它公司的最大不同點(diǎn)是什么?
蘋果的特點(diǎn),或者說秘訣,有3個(gè):
1. 蘋果從上到下一貫堅(jiān)持的就是:“我們是一家消費(fèi)電子公司,做面向大眾的消費(fèi)計(jì)算機(jī)產(chǎn)品”。這個(gè)定位在喬布斯重新上位之后明確了,并且毫不動(dòng)搖。
2. 產(chǎn)品經(jīng)理有絕對(duì)話語(yǔ)權(quán)。研發(fā)人員在努力創(chuàng)新,努力工作,打造極致的技術(shù)和產(chǎn)品。但做的東西什么時(shí)候能上線,他們永遠(yuǎn)不知道,有時(shí)候感覺永遠(yuǎn)在等待。只有產(chǎn)品經(jīng)理能決定這個(gè)功能是否做得足夠好,;這個(gè)功能是否和其它功能結(jié)合在一起給用戶優(yōu)秀的價(jià)值。只有滿足這些了,功能才會(huì)上線。產(chǎn)品經(jīng)理對(duì)體驗(yàn)和價(jià)值有極高的要求,和時(shí)間點(diǎn)的良好把控。
3. 對(duì)什么是創(chuàng)新的定義。
Tim Cook接受CG雜志的采訪曾經(jīng)說過:“Apple looks to make a significant contribution and own the primary technology when entering a market, as that is how innovation happens. Apple isn’t interested in simply putting together pieces of someone else’s technology.”
蘋果如果要進(jìn)入某個(gè)市場(chǎng),那一定要做出重大貢獻(xiàn)并擁有核心技術(shù),因?yàn)檫@才是真正的創(chuàng)新。不會(huì)僅僅把別人的技術(shù)拼湊在一起,蘋果對(duì)這樣的做法不感興趣。
· 蘋果的定位是高端?是貴?
我覺得這是誤區(qū),沒有把因果關(guān)系搞清楚。貴和高端只是表象和結(jié)果,而不是本質(zhì)和原因。
喬布斯曾經(jīng)在被采訪的時(shí)候回答過:“蘋果對(duì)產(chǎn)品的要求是:做一個(gè)產(chǎn)品,就要讓這個(gè)產(chǎn)品好到自己會(huì)毫不猶豫的推薦給家人和朋友們。“ “而不要像有些公司,為了降低成本而降低質(zhì)量和省去必要的功能。功能需要完整,蘋果不能去賣那種缺失了功能的垃圾。“
所以蘋果只是不想賣“垃圾”而已,造成的結(jié)果是產(chǎn)品看起來比較高端,比其它公司的產(chǎn)品貴。當(dāng)然,各公司對(duì)什么是“垃圾”的衡量標(biāo)準(zhǔn)不同。
但我認(rèn)為,最底線的要求是deliver the promise:設(shè)計(jì)的時(shí)候想要達(dá)到的產(chǎn)品價(jià)值和想向用戶提供的功能,最終在產(chǎn)品里是否真達(dá)到了用戶能夠認(rèn)可這設(shè)計(jì)價(jià)值的程度?
比如,Hololens的promise是,能夠提升人的生產(chǎn)率,能夠玩好玩的AR游戲。它Deliver了這個(gè)promise么?沒有。
· 有人說,Vision Pro沒什么,里面的所有功能在其它頭顯里都找得到…
明顯的酸葡萄說法。在iPhone 1代推出之前Nokia已經(jīng)推出了N95。N95的功能和配置應(yīng)有盡有,沒有什么功能是iPhone沒有的。還有更好的相機(jī)硬件,賣更高的價(jià)格:
但相比iPhone,N95的每個(gè)app都丑陋,東拼西湊。整體的UI和交互缺乏美感,缺乏愉悅,使用不便。
所以,Vision Pro和其它XR產(chǎn)品的區(qū)別不在于功能,而是在于設(shè)計(jì)。而設(shè)計(jì)觸及到的是人的靈魂。
最前面也做了對(duì)比, Vision Pro發(fā)布會(huì)上所重點(diǎn)宣導(dǎo)的所有功能點(diǎn)和iPhone 1發(fā)布會(huì)上的都甚至毫無區(qū)別。所以創(chuàng)新在于藝術(shù),美感,情感,生活方式。
從深層次思考,Vision Pro賣的是:藝術(shù),感情,“時(shí)空機(jī)”,讓不可能變?yōu)榭赡?hellip;
蘋果產(chǎn)品里的動(dòng)畫大量是經(jīng)過精心設(shè)計(jì)的,非線性的。而Google沒有仔細(xì)打磨,都是簡(jiǎn)單的線性動(dòng)畫。
這是我在2010年在松下硅谷研究院設(shè)計(jì)和實(shí)現(xiàn)了的3D UI系統(tǒng),能看出其光影效果的使用,表達(dá)了輕松愉悅陽(yáng)光, 而每個(gè)icon的動(dòng)畫,是擬人“走向前鞠躬”,給用戶被尊重被服務(wù)的感受。
Apple Vision Pro的眼動(dòng)設(shè)計(jì)包含了一個(gè)新設(shè)計(jì):當(dāng)用戶注視某個(gè)UI控件一段時(shí)間后,控件會(huì)顯示關(guān)于它的更多信息。
當(dāng)時(shí)2010年做的3D UI也有被用戶注視后,UI控件知道用戶對(duì)它感興趣,會(huì)自動(dòng)顯示關(guān)于它的更多信息。實(shí)際上其核心思想是:每個(gè)UI Element是“活的”,要賦予其生命,它需要會(huì)表達(dá)感情,它需要自己知道如何和用戶互動(dòng)。
· HCI的進(jìn)化方向:智能的生成式的HCI
上面,在2010年的工作,已經(jīng)認(rèn)識(shí)到UI的發(fā)展方向是:UI(計(jì)算機(jī))應(yīng)該是不停的觀察用戶,自主的理解用戶,自主的向用戶表達(dá)。也就是:智能的,生成式的UI。
GPU/高性能計(jì)算,經(jīng)過了3個(gè)時(shí)期,每個(gè)時(shí)期提高了100x的算力,來解決確實(shí)需要100x算力才能解決的問題:
1. 3D圖形:
1998年至2012年是3D渲染蓬勃發(fā)展的時(shí)期,計(jì)算機(jī)可以做到把預(yù)建好的3D物體的模型變?yōu)楹苷鎸?shí)的圖像。
2. 計(jì)算機(jī)視覺(判別式AI):
3D渲染的逆過程是計(jì)算機(jī)視覺:已知真實(shí)圖像,想算出其背后的3D物體的模型。這個(gè)逆過程需要比正過程大100倍的算力。在~2012年之后變?yōu)楝F(xiàn)實(shí),并蓬勃發(fā)展了10年。
3. 生成式AI (Generative AI):
判別式AI本質(zhì)上是做選擇題。而生成式AI是做作文題,繪畫題。需要比簡(jiǎn)單的選擇題高100倍的算力。
在2015年之后,Leap Motion和uSens都不約而同的開始采用深度學(xué)習(xí)方法的計(jì)算機(jī)視覺(判別式AI)解決3D手勢(shì)識(shí)別問題,并在~2017年達(dá)到了很好的可商業(yè)化的效果。
而在2017年之后,uSens開始認(rèn)識(shí)到,下一個(gè)時(shí)代是生成式AI的時(shí)代。在HCI方面,計(jì)算機(jī)將和人完全對(duì)等:表達(dá)能力上達(dá)到和人相同,可以有擬真的語(yǔ)音,3D面部形態(tài),3D動(dòng)作;理解力上達(dá)到和人相同:理解人的自然語(yǔ)言,理解人的舉手投足表情目光所有細(xì)節(jié)表現(xiàn)。我們將告別鼠標(biāo)-鍵盤-觸摸屏 的階段。人-機(jī) 完全對(duì)等:
蘋果Vision Pro因?yàn)槠鋬?nèi)置的感知硬件,加上未來的算法完全可以達(dá)到這一點(diǎn)。但目前出于成熟度,和用戶的接受過程考慮,并沒有直接上升到這種交互方式。未來可能會(huì)演變到這一方式。
題外話,關(guān)于生成式AI和Leap Motion:
2019年之后uSens開始采用GAN的方式處理手部圖像數(shù)據(jù),生成手部圖像數(shù)據(jù),達(dá)到和真實(shí)圖像的alignment,以假亂真。Leap Motion應(yīng)該同期也開始研究這類生成式方法。2019年Leap Motion公司被收購(gòu)后,美國(guó)公司把所有服務(wù)器都賣了,CTO David Holtz離開了公司。他繼續(xù)在生成式AI方面研究,在2022年做了出大家現(xiàn)在都知道的MidJourney。
Vision Pro定價(jià)實(shí)在太高?Vision Pro會(huì)不會(huì)是一個(gè)叫好不叫座的產(chǎn)品?
實(shí)際上,花了如此高的成本,剛剛達(dá)到了MVP的最底線。實(shí)驗(yàn)剛剛能夠“開啟”。
最好的產(chǎn)品是既叫好又叫座,這極難做到,蘋果的之前每個(gè)新產(chǎn)品都做到了。這次,蘋果Vision Pro顯然做到了叫好, 是否能做到叫座?
有人說Vision Pro沒有解決任何實(shí)際問題和需求。我認(rèn)為,不要從功能角度思考問題。如果只是從功能角度,那么iPhone和N95一樣,可能還不如N95,為什么iPhone成功了?如果只是從功能角度,那么Vision Pro和iPhone是一樣的,為什么Vision Pro不能成功?關(guān)鍵是體驗(yàn)上的提升,而不是功能上的。
但Vision Pro的問題是便攜性的下降,使用場(chǎng)景的下降。所以它不會(huì)是一個(gè)叫座的產(chǎn)品。但是它會(huì)是一個(gè)分水嶺的產(chǎn)品。
做一個(gè)類比:數(shù)字相機(jī)革命的過程。
一個(gè)重要的基石性產(chǎn)品是佳能D1s, 2002年發(fā)售,$7999。它是第一個(gè)能夠從各方面(畫質(zhì),對(duì)焦能力,測(cè)溫能力,拍攝延遲,連拍速度,…)完全超越最先進(jìn)的膠片相機(jī)的數(shù)碼相機(jī)。
要完成從膠片相機(jī),到數(shù)碼相機(jī)的革命,不是有一堆低端的point and shot相機(jī),想靠易用性來彌補(bǔ)劣質(zhì)的像質(zhì)就能完成的。這些相機(jī)給用戶帶來的是惡劣的感受,和慢慢的吃灰。
1Ds開始讓最專業(yè)攝影師都認(rèn)可:如果不考慮價(jià)格和重量,數(shù)碼相機(jī)是可以完全超越膠片相機(jī)的。這是一個(gè)分水嶺的歷史性時(shí)刻。相當(dāng)于MVP: 新的產(chǎn)品形態(tài)必須能夠真正deliver the promise。
然后2003佳能推出300D , $899。它的畫質(zhì)和拍攝能力雖然不能超過最好的膠片相機(jī),但是可以等同于大眾攝影師手中的普通SLR膠片機(jī)。
剛開始的時(shí)候大眾攝影師依然都是對(duì)數(shù)碼相機(jī)還保持懷疑態(tài)度, 但是凡是看過身邊朋友用300D拍出的圖像,和看到它的價(jià)格,立刻懷疑全部打消,毫不猶豫的下手買一臺(tái)。數(shù)碼相機(jī)開始被所有的攝影者所接受。走過了MVP階段,進(jìn)入Scale-up階段。
所以,對(duì)比佳能的這段歷史, 蘋果Vision Pro的做法也許并不是完全沒有道理。
· Apple Vision Pro 會(huì)成功還是失敗
蘋果Vision Pro作為面向大眾的AR Glass產(chǎn)品,剛剛達(dá)到了MVP的及格線 (MVP : Minimum Viable Product / 最簡(jiǎn)可行產(chǎn)品。) , 其用戶體驗(yàn)剛剛能夠達(dá)到人能接受的最低標(biāo)準(zhǔn),或者說,剛剛能夠deliver the promise。為什么這么說?舉兩個(gè)例子:
1)頭戴式產(chǎn)品對(duì)人產(chǎn)生了不便和痛苦。產(chǎn)品帶來的正向價(jià)值和美好體驗(yàn)必須要大于痛苦才算是“0”分, 達(dá)到了最低要求產(chǎn)品狀態(tài)。蘋果Vision Pro可能剛剛到達(dá)這條線。而其它產(chǎn)品根本沒有達(dá)到。
2)宣稱“能夠在空間中放置多3D窗口,進(jìn)行辦公”。Vision Pro的分辨率,VST延遲, 剛剛達(dá)到能夠做這件事的最低限。而其它宣稱能做這個(gè)的產(chǎn)品根本沒有達(dá)到能用。
如此先進(jìn),優(yōu)秀,復(fù)雜的產(chǎn)品, 耗時(shí)7年,投入人力資金巨大, 才剛剛達(dá)到MVP?
我覺得是的。這是創(chuàng)新的智能設(shè)備和互聯(lián)網(wǎng)應(yīng)用的巨大區(qū)別。Meta是互聯(lián)網(wǎng)基因,可能里面很多人對(duì)此無法理解。
到了MVP這一步, 整個(gè)故事才剛剛開始: 來驗(yàn)證驗(yàn)證整個(gè)產(chǎn)品的想法,里面所有hypothesis(假設(shè))是否成立。來驗(yàn)證整個(gè)“AR, VR是否成立的實(shí)驗(yàn)”才剛剛開始。
在產(chǎn)品定義上,2016年uSens 的Impression Pi頭顯和Apple Vision Pro的相似度很高:
對(duì)于uSens沒能支撐到完成類似的產(chǎn)品,我并不遺憾。非常感謝uSens的投資人,他們對(duì)產(chǎn)品形態(tài)有著同的理解,他們同樣看到了“To大C的下沉浸式3D計(jì)算平臺(tái)”應(yīng)該是什么樣子。但是在實(shí)踐中才發(fā)現(xiàn),要實(shí)現(xiàn)這個(gè)MVP所需要的人力物力和時(shí)間遠(yuǎn)遠(yuǎn)超過了最先的估計(jì),不是創(chuàng)業(yè)公司在幾年內(nèi)能夠完成的。即使Facebook/Meta,微軟,做成這件事需要的時(shí)間和投入也都超出了他們的預(yù)想和承受能力。只有蘋果才剛剛完成這個(gè)實(shí)驗(yàn)的初步搭建。
重要的不是蘋果Vison Pro這款硬件產(chǎn)品的成功失敗, 而是整個(gè)空間計(jì)算這個(gè)想法的成功失敗。蘋果終于走到了實(shí)驗(yàn)正式開啟的這一天。讓我們拭目以待實(shí)驗(yàn)的結(jié)果吧。
· Vision Pro是下一代計(jì)算平臺(tái)的最佳形態(tài)么?
我覺得顯然不是。
1. 價(jià)格和重量。同樣以相機(jī)為對(duì)比:大眾無法接受佳能1Ds,是佳能 300D真正讓高質(zhì)量數(shù)碼相機(jī)進(jìn)入大眾時(shí)代。而且相機(jī)形態(tài)繼續(xù)發(fā)展,現(xiàn)在已經(jīng)進(jìn)入了新的無反‘微單‘時(shí)代,才得以讓數(shù)碼相機(jī)繼續(xù)scale up。
2. 使用時(shí)間和地點(diǎn)的覆蓋能力。人對(duì)計(jì)算機(jī)的追求是:1)人的數(shù)字信息能力的提升,比如顯示和交互能力越強(qiáng)越好, 2)設(shè)備和物理世界的交互能力越強(qiáng)越好,3)能夠使用的時(shí)間和地點(diǎn)覆蓋面越大越好,越靈活越好。
和已有的計(jì)算機(jī)(臺(tái)式機(jī),筆記本,手機(jī))相比,Vision Pro在1)人的數(shù)字信息能力是顛覆性提高, 2)方面比手機(jī)并沒有太大提高, 而在3)是巨大倒退:
所以,Vision Pro不是最終形態(tài)。我們拭目以待的是:
最難的階段已經(jīng)過去了,下一個(gè)階段的機(jī)會(huì)不光屬于蘋果,也屬于其它公司。有多種產(chǎn)品形態(tài)可以做;而且蘋果因?yàn)橐恍﹫?zhí)念,其Vision Pro產(chǎn)品設(shè)計(jì)有不少“不正確”的地方,也是機(jī)會(huì)。
· Apple vs Android,隱私
Vision Pro讓計(jì)算機(jī)真正成為四維空間生物,計(jì)算機(jī)從未如此真切的感受這個(gè)世界,和感受人類。
但同時(shí)這類產(chǎn)品是危險(xiǎn)的。原因是1.對(duì)人的影響力, 2.隱私。
1.對(duì)人的影響力
馬斯克推特里的玩笑:”Apple Vision Pro提供的價(jià)值不就是幻覺么?$20的買致幻蘑菇就能做到。”
這并不完全是玩笑。強(qiáng)大的增強(qiáng)現(xiàn)實(shí)技術(shù)可以對(duì)人的心理產(chǎn)生巨大影響。善意的應(yīng)用可以用此技術(shù)給人愉悅的心情,給人正能量,改善人的心理狀態(tài),讓人更專注,等等。而惡意的內(nèi)容,可以用此技術(shù)獲利:比如讓人沉迷于低效信息,改變?nèi)说馁?gòu)買行為,甚至給人不良心理狀態(tài)。蘋果的一貫作風(fēng),會(huì)對(duì)上線App Store的應(yīng)用進(jìn)行嚴(yán)格的管理,只有對(duì)人有益的,正面的內(nèi)容才能上線。
而Android是自由派作風(fēng),硬件商和應(yīng)用商店商完全以短期利益,盈利和內(nèi)卷為第一目的。大量不良應(yīng)用不被管理。Android陣營(yíng)會(huì)抄襲Vision Pro,但按照這些廠商的一貫做法,這種硬件會(huì)比手機(jī)對(duì)用戶產(chǎn)生更大的傷害。
2. 隱私
Vision Pro對(duì)人,對(duì)環(huán)境的觀測(cè)能力相比手機(jī)有天翻地覆的提高, 能夠幾小時(shí)的全程觀察到人的舉手投足所有細(xì)節(jié)動(dòng)作,面部表情,和眼睛觀察世界和數(shù)字界面的所有過程。對(duì)物理世界也是全程的觀察和識(shí)別。
蘋果做了極高規(guī)格的隱私保護(hù),這些信息蘋果只在本機(jī)處理,并且應(yīng)用無法獲?。☉?yīng)用無法拿到相機(jī)圖像。無法拿到眼動(dòng)數(shù)據(jù),只能知道“眼睛+手勢(shì)”出發(fā)了哪個(gè)UI控件)
但這些信息具有極大商業(yè)價(jià)值,因?yàn)閷?duì)用戶的理解比手機(jī)提高了百倍。而Android陣營(yíng)的特點(diǎn)是:OS設(shè)計(jì)對(duì)隱私保護(hù)不夠強(qiáng),硬件商會(huì)對(duì)OS底層進(jìn)行改動(dòng),商店不對(duì)侵犯隱私的應(yīng)用進(jìn)行攔截,應(yīng)用開發(fā)商之間的內(nèi)卷(侵犯隱私獲利方面的惡性競(jìng)爭(zhēng))。硬件商會(huì)利用這些信息,做新商業(yè)模式,推出表面上看極具價(jià)格優(yōu)勢(shì)的硬件。而更多的硬件商不得不加入同樣商業(yè)模式應(yīng)對(duì)價(jià)格戰(zhàn),陷入內(nèi)卷。受害的是消費(fèi)者。
值得擔(dān)心的是,不受管控的類似Vision Pro的產(chǎn)品,會(huì)讓普通用戶 在1.精神影響,2.利用隱私信息的雙重進(jìn)攻下成為被精神控制的搖錢樹。在這方面的能力,類Vision Pro產(chǎn)品比手機(jī)強(qiáng)百倍。
任何有突破性的重要技術(shù)都是雙刃劍。
· 再次回到問題,Vision Pro這個(gè)產(chǎn)品會(huì)成功還是失???
有的媒體看衰AVP,理由是:和以往的蘋果的產(chǎn)品不同, AVP是在分割一個(gè)很小的,甚至是不存在的市場(chǎng)。以往的蘋果產(chǎn)品都是在一個(gè)很大的市場(chǎng)里做創(chuàng)新,切個(gè)小蛋糕然后擴(kuò)大。
比如比蘋果iPhone一代的發(fā)布會(huì),Steve Jobs明確指出:手機(jī)市場(chǎng)和PC電腦市場(chǎng)相比是一個(gè)大5倍的市場(chǎng)。iPhone試圖革命這個(gè)已有市場(chǎng),如果切出1%的蛋糕,就有1千萬銷量。
而VR,AR市場(chǎng)是很小,并且未被證明的市場(chǎng)。自從2014年已經(jīng)發(fā)展了近10年才只有1千萬臺(tái)的銷量。我覺得這些媒體的看法和擔(dān)憂并不無道理。
iPhone發(fā)布會(huì)的最后一頁(yè):
這里Steve Jobs引用了加拿大”冰球大帝”Wayne Gretzky的名言:“我總是滑到冰球未來將到達(dá)的地方, 而不是滑到冰球現(xiàn)在的位置。” 這句話更適合拿出來給Vision Pro打打士氣。
*聲明:本文系用戶投稿,非VR陀螺官方稿,謹(jǐn)代表作者個(gè)人觀點(diǎn)立場(chǎng),法律問題一切與VR陀螺無關(guān)。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息