編譯/VR陀螺
Facebook 在增強(qiáng)現(xiàn)實(shí)領(lǐng)域投入了大量人力和物力,包括聯(lián)合 Ray-Ban 打造自己的 AR 眼鏡。目前,這些小工具只能記錄和共享圖像,但這些小小的功能又能用來做什么呢?
由 Facebook 人工智能團(tuán)隊(duì)領(lǐng)導(dǎo)的一項(xiàng)新研究項(xiàng)目揭開了這層面紗。該項(xiàng)目希望人工智能系統(tǒng)使用第一人稱視角不斷分析人們的生活,記錄他們的所見所聞,以幫助他們完成日常任務(wù)。Facebook 的研究人員概述了他希望這些系統(tǒng)開發(fā)的一系列技能,包括“情景記憶”(回答諸如“我把鑰匙放在哪里?”之類的問題)和“視聽日記化”(記住誰在什么時(shí)候說了什么)。
未來 Facebook 可能會(huì)利用這種研究
目前,任何人工智能系統(tǒng)都無法可靠地完成上述任務(wù),F(xiàn)acebook 強(qiáng)調(diào)這是一個(gè)研究項(xiàng)目,而不是商業(yè)開發(fā)。然而,很明顯,該公司將這些功能視為 AR 計(jì)算的未來。Facebook 人工智能研究科學(xué)家克里斯汀格勞曼(Kristen Grauman)表示:“當(dāng)然,考慮到增強(qiáng)現(xiàn)實(shí)的未來實(shí)用性,我們有可能利用這種研究,”
這樣的野心有著巨大的隱私影響,隱私專家已經(jīng)對(duì) Facebook 的 AR 眼鏡如何讓佩戴者秘密記錄公眾成員感到擔(dān)憂。如果未來的硬件不僅能記錄錄像,還能分析和轉(zhuǎn)錄,把佩戴者變成行走的監(jiān)控機(jī)器,這種擔(dān)憂只會(huì)加劇。
Facebook 研究項(xiàng)目的名稱是 Ego4D,它指的是對(duì)第一人稱或“以自我為中心”的視頻的分析。它由兩個(gè)主要部分組成:一個(gè)開放的以自我為中心的視頻數(shù)據(jù)集和一系列 Facebook 認(rèn)為 AI 系統(tǒng)在未來應(yīng)該能夠解決的問題。
來源:The Verge
Facebook 收集了 3205 小時(shí)來自世界各地的第一人稱鏡頭
該數(shù)據(jù)集是有史以來最大的數(shù)據(jù)集,F(xiàn)acebook 與全球 13 所大學(xué)合作收集數(shù)據(jù)??偣灿写蠹s 3205 小時(shí)的鏡頭由居住在九個(gè)不同國家的 855 名參與者錄制。負(fù)責(zé)收集數(shù)據(jù)的是大學(xué),而不是 Facebook。參與者(其中一些人獲得報(bào)酬)佩戴 GoPro 相機(jī)和 AR 眼鏡來錄制無腳本活動(dòng)的視頻。拍攝范圍從建筑工作到食物烘焙,再到與寵物玩耍和與朋友交往。大學(xué)對(duì)所有鏡頭進(jìn)行了去標(biāo)識(shí)化處理,其中包括模糊旁觀者的面部并刪除有關(guān)個(gè)人身份信息。
Grauman 表示,該數(shù)據(jù)集“在規(guī)模和多樣性方面都是同類中的首創(chuàng)”。她說,最接近的可比項(xiàng)目包含 100 小時(shí)完全在廚房拍攝的第一人稱鏡頭。“我們不僅將這些人工智能系統(tǒng)的視野打開到了英國和意大利西西里島的廚房,而且還有來自沙特阿拉伯、東京、洛杉磯和哥倫比亞的鏡頭。”
來源:The Verge
Ego4D 的第二個(gè)組成部分是一系列基礎(chǔ)功能,F(xiàn)acebook 希望世界各地的研究人員使用在其數(shù)據(jù)集上訓(xùn)練的 AI 系統(tǒng)嘗試和解決這些問題。
具體來看,這些需要解決的問題包括:
現(xiàn)在,人工智能系統(tǒng)會(huì)發(fā)現(xiàn),解決這些問題中的任何一個(gè)都非常困難,但創(chuàng)建數(shù)據(jù)集和基準(zhǔn)測(cè)試是一種長久合理方法,它可以刺激人工智能領(lǐng)域的發(fā)展。
事實(shí)上,創(chuàng)建一個(gè)特定的數(shù)據(jù)集和相關(guān)的年度競(jìng)賽,稱為 ImageNet,通常被認(rèn)為是最近人工智能熱潮的開始。ImagetNet 數(shù)據(jù)集由研究人員訓(xùn)練 AI 系統(tǒng)識(shí)別的各種對(duì)象的圖片組成。2012 年,比賽的獲勝者使用一種特殊的深度學(xué)習(xí)方法來擊敗競(jìng)爭(zhēng)對(duì)手,開啟了如今的研究時(shí)代。
Facebook 希望 Ego4D 項(xiàng)目能夠?qū)υ鰪?qiáng)現(xiàn)實(shí)世界產(chǎn)生類似的影響。該公司表示,在 Ego4D 上訓(xùn)練的系統(tǒng)有朝一日不僅可以用于可穿戴設(shè)備產(chǎn)品,還可以用于家庭助理機(jī)器人,這些機(jī)器人也依靠第一人稱視角來觀察周圍的世界。
Grauman 說:“該項(xiàng)目有機(jī)會(huì)以一種尚未真正實(shí)現(xiàn)的方式真正促進(jìn)該領(lǐng)域的工作,將我們的領(lǐng)域從分析人類拍攝的大量照片和視頻的能力轉(zhuǎn)移到這種持續(xù)變化的第一人稱視覺流上,AR 系統(tǒng)和機(jī)器人都需要在這種持續(xù)的背景下活動(dòng)。”
來源:The Verge
Facebook 開發(fā)人工智能監(jiān)控系統(tǒng)會(huì)讓很多人感到擔(dān)憂
盡管 Facebook 概述的任務(wù)確實(shí)看起來很實(shí)用,但該公司在這一領(lǐng)域的目標(biāo)卻讓很多人感到擔(dān)憂。Facebook 在隱私方面的記錄非常糟糕,此前還因數(shù)據(jù)泄露遭到了來自聯(lián)邦貿(mào)易委員會(huì)的50 億美元罰款。
它也被 顯示 多次,該公司值增長和參與上述用戶在許多領(lǐng)域的福祉。考慮到這一點(diǎn),令人擔(dān)憂的是,這個(gè) Ego4D 項(xiàng)目中的基準(zhǔn)測(cè)試不包括突出的隱私保護(hù)措施。例如,“視聽日記”任務(wù)(轉(zhuǎn)錄不同人所說的內(nèi)容)從未提及刪除有關(guān)不想被記錄的人的數(shù)據(jù)。
此外,在許多領(lǐng)域, Facebook 更重視增長和參與度,而不是用戶的福利。比如,在這個(gè)Ego4D 項(xiàng)目中的基準(zhǔn)測(cè)試并不包括突出的隱私保護(hù),具體表現(xiàn)為,在“視聽日記”功能中(轉(zhuǎn)錄不同的人說的話),從來沒有提到刪除關(guān)于不想被記錄的人的數(shù)據(jù)。
當(dāng)被問及這些問題時(shí),F(xiàn)acebook 的一位發(fā)言人告訴媒體,它預(yù)計(jì)將進(jìn)一步引入隱私保護(hù)措施。發(fā)言人說:“我們預(yù)計(jì),在公司使用此數(shù)據(jù)集開發(fā)商業(yè)應(yīng)用程序的時(shí)候,他們將為此類應(yīng)用程序開發(fā)保護(hù)隱私保護(hù)措施。例如,在 AR 眼鏡可以增強(qiáng)某人的聲音(音量)之前,它可能會(huì)發(fā)送一個(gè)協(xié)議來征求他人的許可,或者他們可以限制設(shè)備的使用范圍,使其只能從戴眼鏡的人那里接收聲音。
目前,此類保障措施只是假設(shè)性的。
來源:The Verge
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文經(jīng)原作者授權(quán)發(fā)布,不代表VR陀螺立場(chǎng),如需轉(zhuǎn)載請(qǐng)直接聯(lián)系原作者
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺(tái)
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息