文/VR陀螺 豌豆
游戲和其他虛擬世界中通常會設置NPC(非玩家角色),這些NPC通常都是由程序驅動的,玩家則借由他們與游戲進行交互。
逐漸地,人們不滿足于與喜歡的NPC進行單調(diào)而重復的對話,幻想某一天NPC也能傾聽玩家的故事,或是與玩家一同討論他們當天的生活,若是能與他們握手、擁抱,他們也能表現(xiàn)出真人一般的反應,也許會讓人更愿意相信他們是真正的虛擬世界“原住民”朋友,而非一串代碼。
《動物森友會》中,玩家和小動物的互動
如何讓NPC更智能,更有感情?《動物森友會》給小動物們設定了非常豐富的對話內(nèi)容和動作表情,每個小動物都有獨特的外表和性格(以及口頭禪),小動物也會主動與玩家互動(主動打招呼、送禮),這樣的真實感成為了不少玩家們堅持上線的動力。
AI語音只是沉浸式互動的冰山一角
為了讓虛擬角色“活起來”,以AI技術起家的Inworld AI推出了一款供用戶創(chuàng)建AI虛擬角色的開發(fā)者平臺。目前該公司已經(jīng)為其開發(fā)者平臺完成共6000萬美元融資,這筆資金將用于在電子游戲和虛擬世界中創(chuàng)建AI驅動的虛擬角色。
Inworld AI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Ilya Gelfenbeyn此前創(chuàng)建了一家名為API.AI的AI創(chuàng)業(yè)公司,為安卓提供語音助手軟件,并在2016年將其出售給谷歌(現(xiàn)在稱為Google Dialogflow)。幾年后,他和其他聯(lián)合創(chuàng)始人決定繼續(xù)開設新的公司,但這次的核心目標是將AI技術帶入游戲。
圖源:Inworld AI
Gelfenbeyn認為:“我們專注于沉浸式現(xiàn)實:像游戲、元宇宙,以及一些非游戲環(huán)境,如企業(yè)培訓和虛擬活動,這些虛擬世界正在快速發(fā)展,但也許沒有我們大家希望的那么快。”
他補充說:“如果你要生活在這樣的線上環(huán)境中,而且它們的沉浸性很強,那么你會希望所有可交互的事物和角色都像現(xiàn)實世界那樣更具真實感。因此,我們的想法是建立一種工具,使所有類型的創(chuàng)作者和游戲設計師能夠真正建立角色,使這些虛擬世界更加吸引人。”
Inworld AI的創(chuàng)始人以及團隊的專家都在AI領域有著豐富的工作經(jīng)驗,例如前谷歌的Dialogflow NLU/AI團隊首席技術官Michael Ermolenko,以及曾在DeepMind領導應用生成語言模型產(chǎn)品的產(chǎn)品總監(jiān)Kylan Gibbs。
圖源:網(wǎng)絡
為了給游戲、虛擬世界、VR/AR中的虛擬角色帶來更豐富的社交互動。該公司還聘請了視覺效果先驅者John Gaeta作為其首席創(chuàng)意官(提出了《黑客帝國》“子彈時間”的概念,并積極探索XR拍攝方式),他本人也曾擔任Magic Leap創(chuàng)意戰(zhàn)略高級副總裁的執(zhí)行職務。
Gelfenbeyn指出,Inworld 角色不應僅限于言語,而是能夠與人類使用的許多方式進行交互,例如面部手勢、肢體語言、情感以及身體交互。
近幾年元宇宙相關產(chǎn)業(yè)的發(fā)展讓Gaeta看到了希望,他更想做的是實現(xiàn)人們可以在虛擬世界里走動,并與其中的人進行更深層互動的場景。他與Inworld AI的創(chuàng)始人見面后,更是堅定了“從虛擬角色開始入手”的想法。
Gaeta在提及AI虛擬角色時表示,多年以來一直深受斯坦利·庫布里克、菲利普·狄克和史蒂文·斯皮爾伯格等人在AI角色方面的科幻作品啟發(fā)。
“試想一下,當一個新誕生的虛擬NPC在幾分鐘內(nèi)就能生成全新的人格,并且在這段時間內(nèi),你就能夠與它進行對話……因此,我認為這(AI虛擬角色)有可能是一種結合了驚人的想象力和全新形式的藝術。”
以人類大腦為靈感,加強AI感知、認知和行為
Inworld AI以人類的大腦為靈感來構建技術堆棧,Gelfenbeyn將其分為三個主要組成部分:感知、認知和行為。
其中感知側重于輸入和對環(huán)境和其他方面的理解,主要利用聽覺、視覺等感官;在認知方面,主要由虛擬角色的內(nèi)部狀態(tài)決定,例如記憶、情感、個性、目標和背景;行為關乎虛擬角色的輸出和交互,例如語音、手勢、肢體語言和動作。
為了讓虛擬角色能夠以聽覺和視覺的方式感知環(huán)境,Inworld AI試圖通過融合自然語言理解和處理、光學字符識別、強化學習和會話AI等AI技術來模仿人類的認知能力,以開發(fā)復雜的虛擬角色——可以甚至回答問題并進行對話。
圖源:Inworld AI
在Inworld AI的虛擬角色開發(fā)平臺,首先需要用幾句話設定好虛擬角色的身份,并調(diào)整角色的個性組合,然后可以通過設置關鍵詞來決定該虛擬角色的生活狀態(tài)、動機、情緒等等,當然也可以設置具體問題進行固定對話。
與OpenAI的模型相比,Inworld AI有大約20個不同的機器學習模型,負責角色個性的不同方面。用戶不需要輸入代碼,系統(tǒng)便可直接幫助虛擬角色推斷如何回應問題并快速作出反應。
在視頻的簡介中提到,這名AI虛擬角色Rufus的所有對話都是使用Inworld AI實時生成的。環(huán)境和視覺效果是使用Unity構建的。
Inworld AI員工與虛擬角色進行對話測試
Inworld AI生成的虛擬角色在準備正式進行交互和測試之前會經(jīng)歷一個“訓練”過程,可以選擇通過Inworld AI的Oculus配套應用程序在VR中進行。然后可以通過通用引擎等方式將虛擬角色集成到游戲和應用程序中。
AI和機器學習開發(fā)領域競爭激烈,有Open AI和Google Al等老牌技術供應商在前,但Inworld AI并沒有與他們一較高下的想法,而是選擇在垂直領域,嘗試填補AI領域上的空白。它以高度專業(yè)化的解決方案,用于為AI驅動的虛擬角色開發(fā)對話式AI,而不是通用機器學習模型。
智能AI虛擬角色離我們并不遙遠
玩家都會有在游戲中遇到NPC并與之交談的經(jīng)歷。通常情況下他們會被認為是“安排任務”的角色,說了幾句話(或者關閉游戲)之后,就進入了一種休眠狀態(tài),玩家再次登錄后NPC又不斷重復各自的臺詞。
為什么要給虛擬NPC更多的智能,將AI分配給更多的操作體驗和環(huán)境不是會更好嗎?事實上,從游戲的角度看,整個虛擬世界的故事的線性發(fā)展甚至包括開放世界,基本都是圍繞用戶與NPC的互動和對話來推動的。
圖源:Inworld AI
如果由AI驅動的NPC具有用戶和故事背景中不曾提及的知識,玩家可以選擇與他們交友、組隊甚至是威脅,這將為虛擬世界帶來更多樣化和生動的體驗。
Inworld AI考慮到這一點,在自由交談的前提下提供了安全對話模式。
如平臺允許開發(fā)者將單詞和特定主題列入黑名單,打開安全過濾器,并在出現(xiàn)問題時刪除對話。Inworld AI聲稱是最早使用OpenAI的Moderation端點的公司之一,該工具可以分析文本以查看它是否包含任何應該被過濾掉的內(nèi)容,包括仇恨或暴力言論、性相關內(nèi)容和唆使自殘的信息。
Inworld AI的虛擬角色平臺仍處在測試階段,目前正在與一些3A級游戲工作室和其他企業(yè)合作開發(fā)并完善該平臺。
來源:Inworld AI
據(jù)了解,Inworld AI作為2022年入選迪士尼加速器計劃的六家公司之一,迪士尼將為這些公司提供指導、投資資金以及進入迪士尼創(chuàng)意園區(qū)共享工作空間的機會,共同打造沉浸式體驗的未來。該公司正準備開發(fā)一款游戲以展示其AI虛擬角色的能力。
Gelfenbeyn表示:“我們的工作重點必須是建立真正具有吸引力和表現(xiàn)力的角色,以便玩家喜歡與他們交談,讓用戶真正享受與角色的互動。我們也非常注重創(chuàng)造力,下一步將與MetaHuman和其他平臺合作,這樣就可以創(chuàng)建生成具有更生動的視覺、手勢、動畫和情感特性的虛擬角色。”
讓虛擬角色擁有AI或許只是為虛擬世界多一分真實感,得益于內(nèi)容生態(tài)的快速發(fā)展,沉浸式XR體驗的應用場景越發(fā)豐富,不只是游戲,還有文旅教育、展覽導覽等領域都需要智能AI角色的加入。元宇宙也正在成為部分公司用來與用戶交互的新渠道,AI對話式虛擬角色距離更復雜、更完整的形態(tài)還有很長的一段路要走。
投稿/爆料:tougao@youxituoluo.com
稿件/商務合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權申明:本文為VR陀螺原創(chuàng),任何第三方未經(jīng)授權不得轉載。如需轉載請聯(lián)系微信:vrtuoluo233 申請授權,并在轉載時保留轉載來源、作者以及原文鏈接信息,不得擅自更改內(nèi)容,違規(guī)轉載法律必究。文中有圖片、視頻素材來自互聯(lián)網(wǎng)或無法核實出處,如涉及版權問題,請聯(lián)系本網(wǎng)站協(xié)商處理。
元宇宙數(shù)字產(chǎn)業(yè)服務平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息