現(xiàn)有的三維識別系統(tǒng)由于依賴于較強(qiáng)的監(jiān)督,如點(diǎn)級語義標(biāo)注等,都需要較長時間才能獲得結(jié)果。例如,目前流行的大型室內(nèi)3D數(shù)據(jù)集ScanNet僅由20人收集,注釋工作涉及500多人,每次掃描花費(fèi)將近22分鐘。此外,由于標(biāo)注成本高,現(xiàn)有的三維對象檢測數(shù)據(jù)集局限很大,這種耗時的標(biāo)注過程是縮放3D識別的主要瓶頸。
圖源:Facebook
基于這一觀察結(jié)果,F(xiàn)acebook人工智能研究院和伊利諾伊大學(xué)厄巴納-香檳分校的研究人員提出,不用空間標(biāo)注的3D來進(jìn)行空間識別。他們研究了3D弱監(jiān)督學(xué)習(xí),只有場景級別的類標(biāo)簽可用作為監(jiān)督訓(xùn)練語義分割和目標(biāo)檢測模型。場景級標(biāo)注是非常有效的注解,只需要花一秒鐘或更少的時間就可以檢測在場景中的每個對象。
WyPR,是一種用于點(diǎn)云識別的弱監(jiān)督框架。WyPR解決了三個核心3D識別任務(wù)問題:點(diǎn)級語義分割,3D提議生成和3D對象檢測。研究證明,結(jié)合標(biāo)準(zhǔn)的多實(shí)例學(xué)習(xí)目標(biāo),WyPR可以在點(diǎn)云中檢測和分割點(diǎn)云中的對象,而無需在訓(xùn)練時訪問任何場景級標(biāo)注。
圖源:Facebook
WyPR首先使用標(biāo)準(zhǔn)的3D深度學(xué)習(xí)技術(shù)從輸入中提取點(diǎn)級特征表示。為了獲得對象分割,它將每個點(diǎn)分類為一個對象類。WyPR不采用點(diǎn)級監(jiān)督來訓(xùn)練網(wǎng)絡(luò)的這一部分,而是采用多實(shí)例學(xué)習(xí)(MIL)和自我監(jiān)督目標(biāo)來進(jìn)行訓(xùn)練。
接下來,為了獲得對象bounding box,它利用了一種靈感來自于選擇性搜索的全新三維對象建議技術(shù):幾何選擇性搜索(GSS)。每一個建議都像以前一樣使用MIL分類到一個對象類。最后研究人員觀察到,WyPR檢測到的bounding box內(nèi)的所有點(diǎn)與box級預(yù)測保持一致,反映了聯(lián)合訓(xùn)練框架的有效性。
研究人員使用ScanNet和S3DIS數(shù)據(jù)集證明了它的功效,在弱監(jiān)督分割方面優(yōu)于現(xiàn)有技術(shù)(mIoU超過6%)。這為未來的研究建立了弱監(jiān)督3D對象檢測的新基準(zhǔn)。
來源:facebook
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息