編譯 | VR陀螺 云吞
今天很freestyle的小姐姐
六月初,蘋果走出了進軍AR/VR的第一步——推出了ARKit。ARKit中很重要的一項技術(shù)就是SLAM(Simultaneous Localization And Mapping,即時定位與地圖構(gòu)建)。幾乎每一個科技巨頭,尤其是蘋果、谷歌和Facebook,都在SLAM技術(shù)上有著重金砸入,因為對SLAM技術(shù)的應(yīng)用很大程度上決定了各家在AR領(lǐng)域的優(yōu)勢程度。 SLAM是計算機視覺技術(shù)的一部分,它能夠?qū)⑽锢硎澜缰械囊曈X信息以點的形式收集起來,并且讓機器來理解這些信息。SLAM讓機器獲得了“視覺”,同時通過視覺信息輸入可以理解自己周圍的環(huán)境。機器通過SLAM技術(shù)看到的場景就是下圖展示的這樣。 通過這些信息點,機器可以理解自己所處的環(huán)境。這些數(shù)據(jù)同時也可以幫助AR開發(fā)者來創(chuàng)作出更加具有互動性和更加真實的經(jīng)驗。SLAM可以被應(yīng)用在許多不同的場景,比如機器人、自動駕駛汽車AI和AR中。 SLAM技術(shù)最簡單的一種應(yīng)用形式就是用來識別墻壁、障礙物和地板。目前大部分AR SLAM技術(shù),比如ARKit,僅僅用到了地板識別和位置追蹤來將AR物體放置在我們的身邊,因此ARKit實際上并不知道我們的實際環(huán)境究竟發(fā)生了什么,也無法做出正確的回應(yīng)。更加高級的SLAM技術(shù),比如谷歌Tango,可以在我們的環(huán)境中創(chuàng)造出一層網(wǎng)來進行更加精確的定位和識別,因此機器不僅能夠告訴你哪里是地板,同時也能夠識別出環(huán)境中的墻壁和物體,將它們變成可以互動的元素。 在SLAM之前的標記點AR 幾年之前,蘋果收購了業(yè)內(nèi)領(lǐng)先的德國AR公司Metaio。Metaio十分具有創(chuàng)造力,當年在AR市場中擁有很大的分量。我們現(xiàn)在看到的ARKit實際上就是Metaio AR技術(shù)的升級版本。沒錯,在蘋果推出ARKit之前,就已經(jīng)有一些公司在安卓和iOS系統(tǒng)上推出了SLAM技術(shù),比如Wikitude和Kudan。但是蘋果推向市場的東西比普通的SLAM還要更加先進。 在蘋果之前,大部分AR體驗都是基于標記點的,意味著我們必須要用攝像頭掃描一個是固定的、具體的圖像來生成AR。通過這些圖像,我們的設(shè)備可以理解和追蹤疊加在畫面中的數(shù)字內(nèi)容。這種標記點技術(shù)的問題在于,用戶必須要有一個實物作為參照來體驗AR,因此廠商必須同時提升軟件和實物(如宣傳冊等)的效果。 ARKit完全解決了這個問題,我們現(xiàn)在用到的僅僅是手機和我們周圍的環(huán)境。但是在ARKit上還有一件很重要的事情仍然缺失:對上下文環(huán)境(context)的理解! 僅會識別地板是不夠的 標記點AR技術(shù)有局限性,但是它有自己的環(huán)境,即可以通過特定的圖像來理解現(xiàn)實世界,并且可以在這個基礎(chǔ)之上改變AR體驗。比如,我們可以將設(shè)備上的攝像頭對準麥當勞的某個logo,可以獲得麥當勞的AR體驗;在對準星巴克杯子上的logo時,會獲取完全不同的AR內(nèi)容。我們所使用的這些智能設(shè)備上的應(yīng)用叫做AR瀏覽器,在未來的AR中會是關(guān)鍵的角色。 因此,盡管ARKit是一項很棒的技術(shù),但是卻沒有自己的上下文環(huán)境,因為ARKit應(yīng)用并不能夠理解用戶是在哪種場合下使用它。開發(fā)者可以使用一些輸入端,像是GPS數(shù)據(jù)或者環(huán)境中的燈光來增加更多的對應(yīng)環(huán)境,但是ARKit的核心部分仍然是缺少環(huán)境的。上周有一些開發(fā)者用ARKit做出了一些很有趣的導航demo,但是我們必須明白,這些功能的實現(xiàn)依賴于手機本身的GPS數(shù)據(jù),而ARKit自己是無法通過攝像頭的輸入來識別位置的。因此ARKit在這一點上和谷歌Tango可以做到的室內(nèi)導航還差的很遠。 毫無疑問,AR的未來是SLAM技術(shù),但是如何能夠讓AR在生活中更加具有實際的用途,而不僅僅是用來在自家后院里看SapceX火箭降落,就必須要有對應(yīng)環(huán)境的世界。一些公司,比如谷歌,已經(jīng)認識到了這一點。 谷歌實際上并不著急 谷歌的SLAM技術(shù)集成在Project Tango上,同時公司也在和聯(lián)想等合作伙伴一起進行開發(fā)。Tango采用了兩個攝像頭,可以檢測到環(huán)境的深度,同時可以通過SLAM地圖來理解現(xiàn)實世界。和蘋果的ARKit不同,Tango的核心是有對應(yīng)環(huán)境的,因此可以做到室內(nèi)導航,因為其比ARKit要高級的多。SLAM地圖是機器對世界的視覺理解的數(shù)據(jù)庫,其重要性在于,能夠讓機器和物理世界進行交互,同時可以實現(xiàn)機器自我區(qū)別兩個不同的地點。 盡管最近看好ARKit前景的報道非常之多,但是谷歌實際上在AR游戲方面要領(lǐng)先很多。這是因為,歸根結(jié)底,對環(huán)境的認知是最重要的事。谷歌已經(jīng)擁有了自己的對應(yīng)環(huán)境,同時可以通過Google Lens來獲取對世界的視覺理解信息。這部分數(shù)據(jù)在未來將會更加寶貴,因為人們將會逐漸從移動設(shè)備轉(zhuǎn)向AR眼鏡等可穿戴設(shè)備。 Facebook正在努力追趕 實際上,谷歌在AR領(lǐng)域最大的競爭者不是蘋果,而是Facebook。Facebook擁有驚人的20億用戶社群,一旦小扎想出了讓社群掌控地圖定位的方法,就會給Facebook帶來非常大的優(yōu)勢。和蘋果不同,F(xiàn)acebook的AR布局全部都內(nèi)置于自己的應(yīng)用里,用戶無法在其他的應(yīng)用上使用。 有分析師指出,蘋果讓用戶在其他應(yīng)用里也能夠使用AR技術(shù)是一種比Facebook更加高明的手法。但是長久看來,隨著現(xiàn)實世界視覺地圖的戰(zhàn)爭不斷升級,像Facebook這樣將所有的信息鎖在自己的地盤里將會是更大的優(yōu)勢。 Snap同樣擁有很大的用戶群體,同時也看到了在AR方面的契機。在近日申請的專利中,Snap展示了一種技術(shù),可以將GPS數(shù)據(jù)和SLAM地圖相結(jié)合,將對應(yīng)的AR內(nèi)容放置在現(xiàn)實世界中。同時,聯(lián)想也和Wikitude聯(lián)手打造了一個SLAM數(shù)據(jù)庫,名為“增強人類云”。 得數(shù)據(jù)庫者一統(tǒng)天下 在筆者看來,擁有最完整SLAM數(shù)據(jù)庫的公司將是最終的贏家。這一數(shù)據(jù)庫將會讓科技巨頭們的機器可以真正的看懂世界。比如,F(xiàn)acebook可以通過簡單的圖像分析來為你新拍攝的照片打上位置標簽;谷歌可以通過分析你的智能眼鏡的攝像頭傳回的信息,來更加精準的投放虛擬廣告;你的自動駕駛汽車可以通過視覺數(shù)據(jù)來實現(xiàn)自動導航。 話又說回來,盡管科技巨頭們都知道數(shù)據(jù)庫的重要性,但它們目前在該領(lǐng)域的優(yōu)劣勢卻不盡相同。投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息