Eternal sunshine and the spotless mind – 永恒陽光下的潔凈心靈
本文系投稿,作者:費越 博士
對Vision Pro的總體看法
Apple Vision Pro發(fā)布會后很多人的興奮程度不亞于2007年人們看完iPhone 1代發(fā)布會后的興奮程度。總的來說,Apple Vision Pro是一個非常非常蘋果風(fēng)格的產(chǎn)品。Vision Pro和其它XR頭顯所強調(diào)的東西完全不同:并沒有強調(diào)沉浸式游戲,而是和蘋果歷史以來一貫所強調(diào)東西高度一致:那就是面向普通消費者,面向普通人。
因為Apple Vision Pro發(fā)布會上所強調(diào)的核心應(yīng)用,給用戶的核心價值有3個:1. Entertainment – 影音娛樂, 2. Socializing – 社交通訊,3. Productivity – 兼容大量已有的2D應(yīng)用。
如果對比2007年iPhone 1代的發(fā)布,會發(fā)現(xiàn)驚人的類似。iPhone的3個核心價值主張是一摸一樣的:1. iPod - 影音,2. Phone/Face Time - 通訊,3. Internet Browser - 兼容大量已有的應(yīng)用 (在2007年的時候還沒有App概念。一個一個的網(wǎng)站,比如Amazon, Facebook, 微博, 就是一個一個應(yīng)用)。
所以,Vision Pro和iPhone 1發(fā)布會上的核心應(yīng)用是一模一樣的3個:
并且保持了蘋果一貫的發(fā)布會上事不過三的原則,消費者的大腦無法記住超過3個重點。
除了上面3個核心賣點,Vision Pro和iPhone發(fā)布會上提及的第二級附屬功能也是驚人的完全一致:1. 為此新平臺專門開發(fā)的新應(yīng)用, 2. 拍照和看照片(內(nèi)容生產(chǎn),UGC)
1.為此新平臺專門開發(fā)的新應(yīng)用。iPhone 1 對比 Vision Pro:
2. 拍照和看照片(內(nèi)容生產(chǎn),UGC):
把AVP發(fā)布會上對產(chǎn)品的所有價值主張和iPhone一代發(fā)布會做個對比:
它們是一模一樣的。由此可見蘋果對消費者核心需求的理解和實操保持了相當(dāng)強的一貫性和一致性。因為普通人是普通的生活方式。人們希望能夠輕松快樂地:娛樂,工作,溝通,創(chuàng)作。
蘋果這次很踏實,并沒有標(biāo)新立異的對一個新硬件創(chuàng)造出一套新奇的需求體系。這是由于蘋果對消費者最重要的,最本質(zhì)需求的深刻理解:消費者是同樣的消費者,不要試圖用花活把消費者改造成適應(yīng)新技術(shù)的新人,而是要讓技術(shù)適應(yīng)人。
有人這樣類比:之前的VR頭顯的設(shè)計是滿足一群奇怪的人 “能那種家里來了客人正在聊天,他自己卻鎖起門來玩10個小時游戲的那種怪人” , 而Vision Pro滿足的你我他,所有正常人。
VR從游戲機開始?
過去的幾年大部分VR公司都把產(chǎn)品形態(tài)收斂為游戲機,包括HTC、Oculus等。
這并沒有錯,因為VR的技術(shù)水平和體驗只能滿足游戲機的用戶體驗要求。
這和個人電腦發(fā)展歷史非常相似:當(dāng)電腦進入2C市場的時候,首先被做成的也是游戲機,1972年Atari,而2C的個人電腦形態(tài)1977年才出現(xiàn),Apple II。
隨身的移動電腦的發(fā)展也類似,首先出現(xiàn)的產(chǎn)品也是游戲機:2004年的PSP (PlayStation Portable), 同年Nokia發(fā)布了游戲機手機N-Gage(不知道有多少人記得),2005年的Nintendo DS。
2007年才出現(xiàn)的通用型的移動計算機:iPhone。
所以在技術(shù)水平達(dá)不到成為2C計算機形態(tài)的時候,往往首先能夠滿足游戲機形態(tài)。那么就先做游戲機是合理的選擇,能夠做出成功的產(chǎn)品,比如Oculus Quest 2。
· 為什么其它VR頭顯都是主攻游戲,而蘋果并沒有做游戲機?
因為蘋果是一個2大C的公司,想要做新的計算平臺服務(wù)大眾消費者。本質(zhì)問題是:能否先做游戲機,然后過度和升級成為計算平臺型的產(chǎn)品?
從歷史中看,做出了成功游戲機品的公司都并沒有轉(zhuǎn)化為做通用形計算機。比如Atari,Nintendo FC,SONY PlayStation… 以游戲做為出發(fā)點的設(shè)備并沒有在未來成功演化為通用消費設(shè)備。
我認(rèn)為VR也是這樣,游戲機雖然從歷史和市場角度是個好產(chǎn)品,但無法以此為基點演化為通用消費設(shè)備。因為設(shè)計一個通用消費設(shè)備需要全身心的投入,design from ground up,不做任何妥協(xié) 。就像油改電是無法做出好的電動車。做通用型計算平臺比做游戲機更難,更需要時間和耐心,但回報也是巨大的。
其本質(zhì)原因是什么?不知道??赡艿脑蚴牵阂鲆粋€成功產(chǎn)品,其組織管理,團隊成員的能力,和文化一定是高度的適合這個產(chǎn)品。原因是,成功是極為困難的,成功的產(chǎn)品需要團隊100%的投入和專業(yè)化。產(chǎn)品和團隊是相互打造的,一個產(chǎn)品是公司人員,管理,文化的直接映像。同樣的團隊再開發(fā)一個完全不同類型的產(chǎn)品,團隊的意愿很小,能成功的可能性很小。
有個說法是,對于創(chuàng)業(yè)團隊 “you can pivot, but you can‘t hedge” :如果發(fā)現(xiàn)產(chǎn)品或商業(yè)模式的方向不對,那么全員轉(zhuǎn)向新的產(chǎn)品和商業(yè)模式并100%的投入進去,是可以的;但絕不能腳踩兩只船,同時平行做多個不同的東西投機。
Facebook的Oculus團隊原本是個很純粹的游戲團隊,對于如何游戲化的設(shè)計整個硬件軟件產(chǎn)品有豐富經(jīng)驗。Quest 1,2是專注而成功的。但Facebook的野心不滿于此。后來混入了做互聯(lián)網(wǎng)的人,和來自蘋果的做2C消費電子產(chǎn)品經(jīng)驗豐富的人,其產(chǎn)生的Quest Pro是一個四不像產(chǎn)品。
為什么蘋果Vision Pro這么重視VST?
蘋果把VST的質(zhì)量放在產(chǎn)品中非常高的優(yōu)先級。在2018年就收購了做VST頭顯的公司VRVana (頭顯產(chǎn)品Totem)。
因為蘋果對用戶有比其它廠家更加深刻的洞察力。對于“VR難以被大眾接受的最大原因是什么?”這個問題,通常的回答列表會是:
這些實際上都是錯誤答案。真正最重要的原因是:看不見真實世界的VR模式是和人類(任何動物)億年進化出來的生物本能相矛盾的。用戶心里永遠(yuǎn)會有不安全感,隱藏在內(nèi)心深處。
uSens和VRVana都是在~2016年的時候把雙目RGB相機VST定義到了2C的頭顯上,是世界上最早定義VST頭顯中的。因為當(dāng)時同樣認(rèn)識到了VR的最大問題在哪里,并且認(rèn)識到了VST能夠開啟的AR大門,實現(xiàn)讓人獲得把不可能變?yōu)榭赡艿某耗芰Α?/p>
uSens的Impression Pi頭顯配置更接近Vision Pro:
蘋果不做用戶問卷,不請外部專家來做評審,因為最重要的原因往往隱藏在用戶心里,用戶自己都不知道,知道也會掩飾不說。所以這是靠問卷訪談得不到的。
蘋果的洞察能力明顯優(yōu)于其它公司,不光從VST硬件和性能上的投入力度,從2個方面也能看出來:
尤其是第二點。因為蘋果洞察到,哪些東西是用戶一定要感覺自己有100%把控能力的。這些東西,如果用戶不能100%把控,內(nèi)心就會有極強的不安全感,那么產(chǎn)品就會出大問題。
VST就是這種用戶從心理層面必須覺得自己有100%成功率的立即控制能力的, 否則用戶就會產(chǎn)生極大不安全感。這種不安全感就是VR的最大障礙。所以加了硬件按鈕。
就像手機的靜音物理開關(guān),Android手機都去掉了這個開關(guān),而iPhone至今還保留了這個物理開關(guān)。蘋果第一個摒棄了物理耳機插孔,但最后一個去掉靜音開關(guān)。因為蘋果不是靠復(fù)雜的功能和能力,而是重視人的心理狀態(tài)。
Apple Vision Pro和Meta等公司頭顯的核心區(qū)別是什么?
有人開玩笑,說VR, AR設(shè)備是占領(lǐng)用戶的臉 ,簡直就像 Alien vs. Predator
蘋果不提XR/MR/VR,回避了產(chǎn)品是不是“占據(jù)用戶的臉”。Vision Pro這個產(chǎn)品的真正意義是:
Vision Pro這個硬件產(chǎn)品只是一個表象而已,這個產(chǎn)品實際上并不算完美,它不是蘋果的目的,未來肯定會進一步演化。要看的是實物的本質(zhì):蘋果的核心演進方向是 1. 占領(lǐng)用戶的視覺,2. 占領(lǐng)整個空間世界, 3. 占領(lǐng)時間。
Vision這個名字取的不錯,它實際上蘊含有幾個意思:1)圖像,視覺效果;2)視野,眼界;3)想象力,對未來的前瞻性;4)幻象,夢幻。所以,是個很好的產(chǎn)品名。
蘋果把產(chǎn)品名定為Vision,把品類名定為Spatial Computing Device : 空間計算機。
蘋果抓住的是1)人性化,人的感受和需求, 2)對未來的深刻理解。這是蘋果和Meta等公司的最大區(qū)別。
其3D拍,3D看,就像電影《Eternal Sunshine of the Spotless Mind》中講述的:“如果可以忘記,如果已經(jīng)不能不忘,我仍不甘心,要將你藏在記憶的最深處,在必須遺忘的最后一刻,還要留下再次相見的暗語。”
uSens在2015~2018年也定義和研發(fā)了頭顯產(chǎn)品:Impression Pi。它的設(shè)計和定位與Apple Vision Pro非常類似。
對產(chǎn)品的命名,品類的命名方式也和蘋果類似。uSens 把產(chǎn)品名定為Impression,把品類名定為Super Reality Device(超現(xiàn)實計算機)。Impress一詞和Vision很類似,深層的意思是:1)外觀,畫面,視覺感受;2)和印象派畫的本質(zhì)一樣,重要的是捕捉稍縱即逝的環(huán)境,創(chuàng)建深度、運動的感覺;3)一種印象,感受,和情感,一種內(nèi)心深處的記憶和表達(dá),而不是表面的圖像而已。一個好的產(chǎn)品,從內(nèi)到外應(yīng)該是一個藝術(shù)品,給人帶來的是情感,就像印象派畫一樣。
蘋果和uSens的共同點是,認(rèn)為這個新產(chǎn)品的本質(zhì)是:
· Apple 和 Google 的區(qū)別是什么?
兩家公司在文化上有本質(zhì)性的巨大區(qū)別。從一個簡單的例子就能看出,兩家公司在AR方面都有多年的算法和應(yīng)用生態(tài)的布局,Apple做了ARKit(ARKit也是Vison Pro產(chǎn)品里的核心視覺算法之一),Google做了對應(yīng)的ARCore。
Apple對ARKit的概括語是: “Change the way you see the world, Realistic and immersive experience.” – 改變你看這個世界的方式,達(dá)到真實和沉浸的體驗。
Google 對ARCore的概括語是 : “Make Physical world acquire Digital attributes, Make the world your digital canvas.” – 讓物理世界獲得數(shù)字屬性,讓世界成為你的畫板。
能看出來,蘋果只講人,只講體驗。Google只講物,只講功能。這就是兩家公司在文化上的本質(zhì)區(qū)別。蘋果是體驗第一,藝術(shù)第一,完美第一。Google是功能第一,而體驗和藝術(shù)感完全沒有,所有東西都像兒童的卡通玩具。
當(dāng)時uSens也對其產(chǎn)品和公司目標(biāo)的概括語是:“Realize your dreams, make impossible possible. Make the digital world as real as possible, and close the gap between the two.” “讓你實現(xiàn)夢想,把不可能變?yōu)榭赡?。讓?shù)字世界和物理世界一樣的真實,并且讓兩者融為一體。” 這個文化和蘋果的更接近一些。
但是要注意到,上面三種對XR目標(biāo)的描述都有重大缺陷:都沒說出來這個東西有什么用?講體驗也好,講功能也好,都是空洞的。對用戶來說到底有什么用處,解決什么問題?誰都沒說清楚,因為誰都沒想清楚。這是XR的最大問題。它很酷,但它有用么?
· 改變?nèi)说纳罘绞? / Changing people’s Lifestyle 可以讓一個新設(shè)備成立
實際上蘋果對于一個新設(shè)備成不成立的評判標(biāo)準(zhǔn)是:這個設(shè)備是否能改變?nèi)说纳罘绞?(Change people’s Lifestyle)。如果能夠給用戶一個某些場景下更好,更舒適愉悅高效的生活方式,那么這個新產(chǎn)品就是成立的。
比如iPad,它對比iPhone沒有任何新功能。但是它能滿足一個新的生活方式:
Apple Vision Pro也是一樣,能夠在某些情景下讓用戶可以放松,安逸,享受,沉浸。這是現(xiàn)在任何一個設(shè)備都無法給人的生活方式。
· 創(chuàng)新點:3D大自然環(huán)境,多應(yīng)用在3D空間中排布
這個設(shè)計,2004年Sun Microsystem和我的創(chuàng)業(yè)公司Infinite 3D同時提出和實現(xiàn)了,release了beta版。這兩個產(chǎn)品的目的是實驗,實驗消費者的反應(yīng)。Sun的系統(tǒng),可以把Sun OS變?yōu)?D OS,所有已有2D應(yīng)用都兼容。Infinite 3D系統(tǒng)把Windows變?yōu)?D OS,兼容所有已有2D應(yīng)用。并且?guī)в?)環(huán)視的3D大自然環(huán)境,2)也可以一起運行遠(yuǎn)程其它計算機上的應(yīng)用,3)新的3D app的framework, 3D UI。當(dāng)時這個系統(tǒng),就是為了未來在真正的XR頭顯上運行的。當(dāng)時選用的環(huán)視3D自然環(huán)境是祖國自豪的珠穆朗瑪峰頂。
Sun Microsystem - Looking Glass
Infinite 3D
3D Launcher的設(shè)計,后來也出現(xiàn)在了2008年的Mac OS上:
這種空間計算,3D UI給用戶帶來的好處是:
那為什么沒有把它放到uSens的頭顯和后來做的其它頭顯里?因為頭顯的分辨率一直不夠高,無法讓用戶達(dá)到這個產(chǎn)品功能所宣稱的要給用戶帶來的好處, 那么就不要上線這個功能。
而蘋果Vision Pro的分辨率領(lǐng)先其它產(chǎn)品首先達(dá)到了足夠的高度,終于可以讓用戶滿意的得到我們所宣稱的東西了。
如果對用戶做了一個promise:這個產(chǎn)品功能有多好,有多么有用, 那么產(chǎn)品一定要deliver the promise,否則就不要上線這功能。如果欺騙用戶,就是欺騙自己,產(chǎn)品一定會吃灰。不要抱僥幸心理。
手眼交互為什么這么神奇
1. 眼睛的運動比手更快,更準(zhǔn)。
視覺信息占大腦處理信息的80%,所以眼睛的轉(zhuǎn)動速度,精度,延遲對生存來說極為重要,眼睛也是距離大腦最近的器官。物理上講,控制眼睛轉(zhuǎn)動的肌肉和手臂連桿結(jié)構(gòu)相比簡單直接得多,轉(zhuǎn)動慣量也小,所以和眼睛比手的尋址運動快得多。
并且眼睛是心靈的窗口,任何細(xì)微的思緒往往難以逃過在眼睛上的反映,更進一步的挖掘眼睛的圖像可以做到對大腦思想的分析。
觸摸屏交互:從大腦下達(dá)了命令到手運動到了目標(biāo)位置有100ms以上的延遲,而觸摸屏本身再加~80ms的延遲。而眼睛本身響應(yīng)大腦的命令到運動到目標(biāo)只有~50ms延遲,眼動系統(tǒng)~15ms延遲,遠(yuǎn)快于手部交互。
2. 因為眼睛的運動并不是用戶的額外負(fù)擔(dān)。
不管你用什么其它的交互方式,不管是鼠標(biāo),觸摸屏,還是手勢, 實際上你的眼睛反正都要先去看你想點擊的UI控件, 然后再移動手。
手的動作是人要額外努力去做的動作,不是必須的行為;而眼睛的動作不是額外的,是下意識里就已經(jīng)完成了。所以,用戶從習(xí)慣了用手交互轉(zhuǎn)到用眼手結(jié)合,會有前所未有的讀心術(shù)的感受:“這個系統(tǒng)怎么會這么快?大腦想什么就能立刻實現(xiàn)什么?”。
實際上不是眼睛太神奇,而是手太慢。我們原先習(xí)慣適應(yīng)了非常緩慢的手部尋址交互,而不覺得它慢。所以,這也印證了蘋果經(jīng)常說的:不要搞用戶調(diào)研,不要問用戶他有什么痛點,因為用戶已經(jīng)麻痹了。必須把新東西做好了,擺在用戶面前,用戶才會明白。
這個手眼交互方式和軟硬件系統(tǒng),2011年我在硅谷的松下研究中心(位置就在現(xiàn)在蘋果總部旁邊200米的地方)就已經(jīng)實現(xiàn)了。并發(fā)現(xiàn)了這種手眼結(jié)合交互的神奇感受,這是最佳的交互方式。
當(dāng)時眼動系統(tǒng)采用了Tobii和SMI的方案。后來Tobii于2014年上市,而2017年SMI被蘋果收購,支撐了蘋果的Vision Pro產(chǎn)品。
既然,手眼結(jié)合的交互不是新鮮事,為什么在其它頭顯沒有采用?
1. 松下的模式是: 把研究結(jié)果放到“保險箱”里,等未來有客戶有需求了就拿出來。但客戶不懂人機交互,怎么知道自己有這個需求呢?但至少松下有專利保護,也不算白做了研究。
2. 這個交互方式的優(yōu)秀性也有不少人直接憑空就能想到。比如國內(nèi)造車新勢力中的一家,2019年的時候其創(chuàng)始人就直接想到了在汽車中使用這個交互方式,并希望uSens能幫助其實現(xiàn)。對他的感悟力我感到欽佩。但需要眼動達(dá)到極高的精度和靈敏度,會讓公司在投入的資金,和時間需要的等待方面望而卻步。因為這是一個長期的,并需要冒險進行領(lǐng)先整個業(yè)界的投入,而不是簡單購買一些模塊拼湊出來。
3. 而蘋果,收購了SMI之后能夠內(nèi)部和硬件,光學(xué),傳感器和算法等多部門合作,做垂直的整體優(yōu)化。所以能夠達(dá)到足夠的精度滿足產(chǎn)品需要。這就是下面要說的,蘋果 “不做拼湊式創(chuàng)新”,因為這是不可能的。
4. 其它VR公司在做“游戲機”方向,所以成本控制極為嚴(yán)格。并且6DoF手柄和沉浸式游戲進行交互是重點問題,如何和UI改進交互不是重點要解決的問題。手-眼 交互方式不是萬能的,并不適合沉浸式6DoF游戲
· 蘋果的手勢交互為什么這么好
蘋果采用了紅外相機并帶有紅外補光,這樣圖像的質(zhì)量和穩(wěn)定性更高,可以達(dá)到更魯棒更精確的手勢識別效果。
而這個硬件方案Leap Motion和uSens在~2013年就發(fā)明,并在~2018年通過深度學(xué)習(xí)的算法達(dá)到了非常好的產(chǎn)品級效果。
但現(xiàn)在的其它頭顯為什么都沒有采用?比如,HTC Cosmos等用的是VST的雙目RGB相機,Quest 2和Pro用的是SLAM的灰度相機。因為這些頭顯都在拼游戲機市場,陷入了成本內(nèi)卷,為了最低的成本,讓手勢成為二等公民,復(fù)用專門為其他目的而已經(jīng)放在了產(chǎn)品上的相機。
蘋果追求極致的手勢效果,所以采用了這個方案。說明產(chǎn)品經(jīng)理,和上下全鏈路整合優(yōu)化起到了關(guān)鍵作用。和眼動一樣,特殊的硬件,加上算法,才能達(dá)到神奇的效果。
說個題外故事,2013年Leap Motion去硅谷某家大公司談合作,大公司里的人對其嗤之以鼻:“你們只是兩三個毛孩子而已, 我們有幾百個算法方面的專家博士,你們的手勢效果不過是騙人的障眼法而已,我們分分鐘就能做出來。”
2016年uSens參加一個專家評審,當(dāng)時uSens已經(jīng)能夠在高通800移動芯片上實時50fps運行,并且能夠處理各種3D自然手勢。專家也是很資深做得領(lǐng)先的大學(xué)教授,說:“你們是騙人的,我們最先進的學(xué)術(shù)狀態(tài)也需要在臺式機Nvidia的GPU上才能跑個30fps,而且無法覆蓋各種自然手勢。你們就是騙錢的,都是假的。”
為什么Leap和uSens能夠做到別人不能相信的東西, 原因和蘋果一樣:產(chǎn)品思維。需要從相機硬件,到算法,到執(zhí)行器做垂直的全鏈路優(yōu)化,和全鏈路創(chuàng)新。比如,使用紅外照明:讓困難的手勢識別任務(wù)變得簡單而且更精確,用巧妙的方法獲得優(yōu)勢,而不是只憑在模型上下蠻力。
Leap的CTO David Holtz后來做了Midjourney,也是一樣,其效果令人驚嘆“簡直是不可能的”。他是如何做到的我想應(yīng)該一樣,創(chuàng)新:用各種巧妙的方式解決問題,而不光是蠻力。
蘋果的員工對蘋果的評價是喜憂參半:蘋果的產(chǎn)品能力非常強。但蘋果在research(前沿的科研)方面薄弱,和Google, Meta相比差很多。這個評價是中肯的。
蘋果的核心到底是什么?和其它公司的最大不同點是什么?
蘋果的特點,或者說秘訣,有3個:
1. 蘋果從上到下一貫堅持的就是:“我們是一家消費電子公司,做面向大眾的消費計算機產(chǎn)品”。這個定位在喬布斯重新上位之后明確了,并且毫不動搖。
2. 產(chǎn)品經(jīng)理有絕對話語權(quán)。研發(fā)人員在努力創(chuàng)新,努力工作,打造極致的技術(shù)和產(chǎn)品。但做的東西什么時候能上線,他們永遠(yuǎn)不知道,有時候感覺永遠(yuǎn)在等待。只有產(chǎn)品經(jīng)理能決定這個功能是否做得足夠好,;這個功能是否和其它功能結(jié)合在一起給用戶優(yōu)秀的價值。只有滿足這些了,功能才會上線。產(chǎn)品經(jīng)理對體驗和價值有極高的要求,和時間點的良好把控。
3. 對什么是創(chuàng)新的定義。
Tim Cook接受CG雜志的采訪曾經(jīng)說過:“Apple looks to make a significant contribution and own the primary technology when entering a market, as that is how innovation happens. Apple isn’t interested in simply putting together pieces of someone else’s technology.”
蘋果如果要進入某個市場,那一定要做出重大貢獻并擁有核心技術(shù),因為這才是真正的創(chuàng)新。不會僅僅把別人的技術(shù)拼湊在一起,蘋果對這樣的做法不感興趣。
· 蘋果的定位是高端?是貴?
我覺得這是誤區(qū),沒有把因果關(guān)系搞清楚。貴和高端只是表象和結(jié)果,而不是本質(zhì)和原因。
喬布斯曾經(jīng)在被采訪的時候回答過:“蘋果對產(chǎn)品的要求是:做一個產(chǎn)品,就要讓這個產(chǎn)品好到自己會毫不猶豫的推薦給家人和朋友們。“ “而不要像有些公司,為了降低成本而降低質(zhì)量和省去必要的功能。功能需要完整,蘋果不能去賣那種缺失了功能的垃圾。“
所以蘋果只是不想賣“垃圾”而已,造成的結(jié)果是產(chǎn)品看起來比較高端,比其它公司的產(chǎn)品貴。當(dāng)然,各公司對什么是“垃圾”的衡量標(biāo)準(zhǔn)不同。
但我認(rèn)為,最底線的要求是deliver the promise:設(shè)計的時候想要達(dá)到的產(chǎn)品價值和想向用戶提供的功能,最終在產(chǎn)品里是否真達(dá)到了用戶能夠認(rèn)可這設(shè)計價值的程度?
比如,Hololens的promise是,能夠提升人的生產(chǎn)率,能夠玩好玩的AR游戲。它Deliver了這個promise么?沒有。
· 有人說,Vision Pro沒什么,里面的所有功能在其它頭顯里都找得到…
明顯的酸葡萄說法。在iPhone 1代推出之前Nokia已經(jīng)推出了N95。N95的功能和配置應(yīng)有盡有,沒有什么功能是iPhone沒有的。還有更好的相機硬件,賣更高的價格:
但相比iPhone,N95的每個app都丑陋,東拼西湊。整體的UI和交互缺乏美感,缺乏愉悅,使用不便。
所以,Vision Pro和其它XR產(chǎn)品的區(qū)別不在于功能,而是在于設(shè)計。而設(shè)計觸及到的是人的靈魂。
最前面也做了對比, Vision Pro發(fā)布會上所重點宣導(dǎo)的所有功能點和iPhone 1發(fā)布會上的都甚至毫無區(qū)別。所以創(chuàng)新在于藝術(shù),美感,情感,生活方式。
從深層次思考,Vision Pro賣的是:藝術(shù),感情,“時空機”,讓不可能變?yōu)榭赡?hellip;
蘋果產(chǎn)品里的動畫大量是經(jīng)過精心設(shè)計的,非線性的。而Google沒有仔細(xì)打磨,都是簡單的線性動畫。
這是我在2010年在松下硅谷研究院設(shè)計和實現(xiàn)了的3D UI系統(tǒng),能看出其光影效果的使用,表達(dá)了輕松愉悅陽光, 而每個icon的動畫,是擬人“走向前鞠躬”,給用戶被尊重被服務(wù)的感受。
Apple Vision Pro的眼動設(shè)計包含了一個新設(shè)計:當(dāng)用戶注視某個UI控件一段時間后,控件會顯示關(guān)于它的更多信息。
當(dāng)時2010年做的3D UI也有被用戶注視后,UI控件知道用戶對它感興趣,會自動顯示關(guān)于它的更多信息。實際上其核心思想是:每個UI Element是“活的”,要賦予其生命,它需要會表達(dá)感情,它需要自己知道如何和用戶互動。
· HCI的進化方向:智能的生成式的HCI
上面,在2010年的工作,已經(jīng)認(rèn)識到UI的發(fā)展方向是:UI(計算機)應(yīng)該是不停的觀察用戶,自主的理解用戶,自主的向用戶表達(dá)。也就是:智能的,生成式的UI。
GPU/高性能計算,經(jīng)過了3個時期,每個時期提高了100x的算力,來解決確實需要100x算力才能解決的問題:
1. 3D圖形:
1998年至2012年是3D渲染蓬勃發(fā)展的時期,計算機可以做到把預(yù)建好的3D物體的模型變?yōu)楹苷鎸嵉膱D像。
2. 計算機視覺(判別式AI):
3D渲染的逆過程是計算機視覺:已知真實圖像,想算出其背后的3D物體的模型。這個逆過程需要比正過程大100倍的算力。在~2012年之后變?yōu)楝F(xiàn)實,并蓬勃發(fā)展了10年。
3. 生成式AI (Generative AI):
判別式AI本質(zhì)上是做選擇題。而生成式AI是做作文題,繪畫題。需要比簡單的選擇題高100倍的算力。
在2015年之后,Leap Motion和uSens都不約而同的開始采用深度學(xué)習(xí)方法的計算機視覺(判別式AI)解決3D手勢識別問題,并在~2017年達(dá)到了很好的可商業(yè)化的效果。
而在2017年之后,uSens開始認(rèn)識到,下一個時代是生成式AI的時代。在HCI方面,計算機將和人完全對等:表達(dá)能力上達(dá)到和人相同,可以有擬真的語音,3D面部形態(tài),3D動作;理解力上達(dá)到和人相同:理解人的自然語言,理解人的舉手投足表情目光所有細(xì)節(jié)表現(xiàn)。我們將告別鼠標(biāo)-鍵盤-觸摸屏 的階段。人-機 完全對等:
蘋果Vision Pro因為其內(nèi)置的感知硬件,加上未來的算法完全可以達(dá)到這一點。但目前出于成熟度,和用戶的接受過程考慮,并沒有直接上升到這種交互方式。未來可能會演變到這一方式。
題外話,關(guān)于生成式AI和Leap Motion:
2019年之后uSens開始采用GAN的方式處理手部圖像數(shù)據(jù),生成手部圖像數(shù)據(jù),達(dá)到和真實圖像的alignment,以假亂真。Leap Motion應(yīng)該同期也開始研究這類生成式方法。2019年Leap Motion公司被收購后,美國公司把所有服務(wù)器都賣了,CTO David Holtz離開了公司。他繼續(xù)在生成式AI方面研究,在2022年做了出大家現(xiàn)在都知道的MidJourney。
Vision Pro定價實在太高?Vision Pro會不會是一個叫好不叫座的產(chǎn)品?
實際上,花了如此高的成本,剛剛達(dá)到了MVP的最底線。實驗剛剛能夠“開啟”。
最好的產(chǎn)品是既叫好又叫座,這極難做到,蘋果的之前每個新產(chǎn)品都做到了。這次,蘋果Vision Pro顯然做到了叫好, 是否能做到叫座?
有人說Vision Pro沒有解決任何實際問題和需求。我認(rèn)為,不要從功能角度思考問題。如果只是從功能角度,那么iPhone和N95一樣,可能還不如N95,為什么iPhone成功了?如果只是從功能角度,那么Vision Pro和iPhone是一樣的,為什么Vision Pro不能成功?關(guān)鍵是體驗上的提升,而不是功能上的。
但Vision Pro的問題是便攜性的下降,使用場景的下降。所以它不會是一個叫座的產(chǎn)品。但是它會是一個分水嶺的產(chǎn)品。
做一個類比:數(shù)字相機革命的過程。
一個重要的基石性產(chǎn)品是佳能D1s, 2002年發(fā)售,$7999。它是第一個能夠從各方面(畫質(zhì),對焦能力,測溫能力,拍攝延遲,連拍速度,…)完全超越最先進的膠片相機的數(shù)碼相機。
要完成從膠片相機,到數(shù)碼相機的革命,不是有一堆低端的point and shot相機,想靠易用性來彌補劣質(zhì)的像質(zhì)就能完成的。這些相機給用戶帶來的是惡劣的感受,和慢慢的吃灰。
1Ds開始讓最專業(yè)攝影師都認(rèn)可:如果不考慮價格和重量,數(shù)碼相機是可以完全超越膠片相機的。這是一個分水嶺的歷史性時刻。相當(dāng)于MVP: 新的產(chǎn)品形態(tài)必須能夠真正deliver the promise。
然后2003佳能推出300D , $899。它的畫質(zhì)和拍攝能力雖然不能超過最好的膠片相機,但是可以等同于大眾攝影師手中的普通SLR膠片機。
剛開始的時候大眾攝影師依然都是對數(shù)碼相機還保持懷疑態(tài)度, 但是凡是看過身邊朋友用300D拍出的圖像,和看到它的價格,立刻懷疑全部打消,毫不猶豫的下手買一臺。數(shù)碼相機開始被所有的攝影者所接受。走過了MVP階段,進入Scale-up階段。
所以,對比佳能的這段歷史, 蘋果Vision Pro的做法也許并不是完全沒有道理。
· Apple Vision Pro 會成功還是失敗
蘋果Vision Pro作為面向大眾的AR Glass產(chǎn)品,剛剛達(dá)到了MVP的及格線 (MVP : Minimum Viable Product / 最簡可行產(chǎn)品。) , 其用戶體驗剛剛能夠達(dá)到人能接受的最低標(biāo)準(zhǔn),或者說,剛剛能夠deliver the promise。為什么這么說?舉兩個例子:
1)頭戴式產(chǎn)品對人產(chǎn)生了不便和痛苦。產(chǎn)品帶來的正向價值和美好體驗必須要大于痛苦才算是“0”分, 達(dá)到了最低要求產(chǎn)品狀態(tài)。蘋果Vision Pro可能剛剛到達(dá)這條線。而其它產(chǎn)品根本沒有達(dá)到。
2)宣稱“能夠在空間中放置多3D窗口,進行辦公”。Vision Pro的分辨率,VST延遲, 剛剛達(dá)到能夠做這件事的最低限。而其它宣稱能做這個的產(chǎn)品根本沒有達(dá)到能用。
如此先進,優(yōu)秀,復(fù)雜的產(chǎn)品, 耗時7年,投入人力資金巨大, 才剛剛達(dá)到MVP?
我覺得是的。這是創(chuàng)新的智能設(shè)備和互聯(lián)網(wǎng)應(yīng)用的巨大區(qū)別。Meta是互聯(lián)網(wǎng)基因,可能里面很多人對此無法理解。
到了MVP這一步, 整個故事才剛剛開始: 來驗證驗證整個產(chǎn)品的想法,里面所有hypothesis(假設(shè))是否成立。來驗證整個“AR, VR是否成立的實驗”才剛剛開始。
在產(chǎn)品定義上,2016年uSens 的Impression Pi頭顯和Apple Vision Pro的相似度很高:
對于uSens沒能支撐到完成類似的產(chǎn)品,我并不遺憾。非常感謝uSens的投資人,他們對產(chǎn)品形態(tài)有著同的理解,他們同樣看到了“To大C的下沉浸式3D計算平臺”應(yīng)該是什么樣子。但是在實踐中才發(fā)現(xiàn),要實現(xiàn)這個MVP所需要的人力物力和時間遠(yuǎn)遠(yuǎn)超過了最先的估計,不是創(chuàng)業(yè)公司在幾年內(nèi)能夠完成的。即使Facebook/Meta,微軟,做成這件事需要的時間和投入也都超出了他們的預(yù)想和承受能力。只有蘋果才剛剛完成這個實驗的初步搭建。
重要的不是蘋果Vison Pro這款硬件產(chǎn)品的成功失敗, 而是整個空間計算這個想法的成功失敗。蘋果終于走到了實驗正式開啟的這一天。讓我們拭目以待實驗的結(jié)果吧。
· Vision Pro是下一代計算平臺的最佳形態(tài)么?
我覺得顯然不是。
1. 價格和重量。同樣以相機為對比:大眾無法接受佳能1Ds,是佳能 300D真正讓高質(zhì)量數(shù)碼相機進入大眾時代。而且相機形態(tài)繼續(xù)發(fā)展,現(xiàn)在已經(jīng)進入了新的無反‘微單‘時代,才得以讓數(shù)碼相機繼續(xù)scale up。
2. 使用時間和地點的覆蓋能力。人對計算機的追求是:1)人的數(shù)字信息能力的提升,比如顯示和交互能力越強越好, 2)設(shè)備和物理世界的交互能力越強越好,3)能夠使用的時間和地點覆蓋面越大越好,越靈活越好。
和已有的計算機(臺式機,筆記本,手機)相比,Vision Pro在1)人的數(shù)字信息能力是顛覆性提高, 2)方面比手機并沒有太大提高, 而在3)是巨大倒退:
所以,Vision Pro不是最終形態(tài)。我們拭目以待的是:
最難的階段已經(jīng)過去了,下一個階段的機會不光屬于蘋果,也屬于其它公司。有多種產(chǎn)品形態(tài)可以做;而且蘋果因為一些執(zhí)念,其Vision Pro產(chǎn)品設(shè)計有不少“不正確”的地方,也是機會。
· Apple vs Android,隱私
Vision Pro讓計算機真正成為四維空間生物,計算機從未如此真切的感受這個世界,和感受人類。
但同時這類產(chǎn)品是危險的。原因是1.對人的影響力, 2.隱私。
1.對人的影響力
馬斯克推特里的玩笑:”Apple Vision Pro提供的價值不就是幻覺么?$20的買致幻蘑菇就能做到。”
這并不完全是玩笑。強大的增強現(xiàn)實技術(shù)可以對人的心理產(chǎn)生巨大影響。善意的應(yīng)用可以用此技術(shù)給人愉悅的心情,給人正能量,改善人的心理狀態(tài),讓人更專注,等等。而惡意的內(nèi)容,可以用此技術(shù)獲利:比如讓人沉迷于低效信息,改變?nèi)说馁徺I行為,甚至給人不良心理狀態(tài)。蘋果的一貫作風(fēng),會對上線App Store的應(yīng)用進行嚴(yán)格的管理,只有對人有益的,正面的內(nèi)容才能上線。
而Android是自由派作風(fēng),硬件商和應(yīng)用商店商完全以短期利益,盈利和內(nèi)卷為第一目的。大量不良應(yīng)用不被管理。Android陣營會抄襲Vision Pro,但按照這些廠商的一貫做法,這種硬件會比手機對用戶產(chǎn)生更大的傷害。
2. 隱私
Vision Pro對人,對環(huán)境的觀測能力相比手機有天翻地覆的提高, 能夠幾小時的全程觀察到人的舉手投足所有細(xì)節(jié)動作,面部表情,和眼睛觀察世界和數(shù)字界面的所有過程。對物理世界也是全程的觀察和識別。
蘋果做了極高規(guī)格的隱私保護,這些信息蘋果只在本機處理,并且應(yīng)用無法獲?。☉?yīng)用無法拿到相機圖像。無法拿到眼動數(shù)據(jù),只能知道“眼睛+手勢”出發(fā)了哪個UI控件)
但這些信息具有極大商業(yè)價值,因為對用戶的理解比手機提高了百倍。而Android陣營的特點是:OS設(shè)計對隱私保護不夠強,硬件商會對OS底層進行改動,商店不對侵犯隱私的應(yīng)用進行攔截,應(yīng)用開發(fā)商之間的內(nèi)卷(侵犯隱私獲利方面的惡性競爭)。硬件商會利用這些信息,做新商業(yè)模式,推出表面上看極具價格優(yōu)勢的硬件。而更多的硬件商不得不加入同樣商業(yè)模式應(yīng)對價格戰(zhàn),陷入內(nèi)卷。受害的是消費者。
值得擔(dān)心的是,不受管控的類似Vision Pro的產(chǎn)品,會讓普通用戶 在1.精神影響,2.利用隱私信息的雙重進攻下成為被精神控制的搖錢樹。在這方面的能力,類Vision Pro產(chǎn)品比手機強百倍。
任何有突破性的重要技術(shù)都是雙刃劍。
· 再次回到問題,Vision Pro這個產(chǎn)品會成功還是失???
有的媒體看衰AVP,理由是:和以往的蘋果的產(chǎn)品不同, AVP是在分割一個很小的,甚至是不存在的市場。以往的蘋果產(chǎn)品都是在一個很大的市場里做創(chuàng)新,切個小蛋糕然后擴大。
比如比蘋果iPhone一代的發(fā)布會,Steve Jobs明確指出:手機市場和PC電腦市場相比是一個大5倍的市場。iPhone試圖革命這個已有市場,如果切出1%的蛋糕,就有1千萬銷量。
而VR,AR市場是很小,并且未被證明的市場。自從2014年已經(jīng)發(fā)展了近10年才只有1千萬臺的銷量。我覺得這些媒體的看法和擔(dān)憂并不無道理。
iPhone發(fā)布會的最后一頁:
這里Steve Jobs引用了加拿大”冰球大帝”Wayne Gretzky的名言:“我總是滑到冰球未來將到達(dá)的地方, 而不是滑到冰球現(xiàn)在的位置。” 這句話更適合拿出來給Vision Pro打打士氣。
*聲明:本文系用戶投稿,非VR陀螺官方稿,謹(jǐn)代表作者個人觀點立場,法律問題一切與VR陀螺無關(guān)。
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息