文/VR陀螺 萬里
隨著元宇宙概念的火熱,形形色色的虛擬數(shù)字人也開始走進了大家的視線。
最近我看到了不少虛擬數(shù)字人的新聞,一個是萬科推出虛擬員工崔筱盼,他的業(yè)務(wù)能力爆表,辦理催收業(yè)務(wù)核銷率達到了91.44%,有正常人千百倍的效率;
此前,洛天依入駐抖音直播,相傳坑位費高達90萬,簡直拳打李佳琦,腳踢羅永浩。
圖源:網(wǎng)絡(luò)
虛擬數(shù)字人,作為元宇宙內(nèi)容的重要交互載體之一,自然也受到了資本市場的青睞。據(jù)不完全統(tǒng)計,2021年虛擬數(shù)字人相關(guān)企業(yè)融資共有2843起,融資金額為2540億元。
今天陀螺君打算跟你們聊一家國外知名虛擬數(shù)字人企業(yè)——Soul Machines。
虛擬數(shù)字人化身打工人
Soul Machines是一家專注于虛擬數(shù)字人研發(fā)的人工智能公司,總部位于新西蘭。根據(jù)數(shù)據(jù)信息服務(wù)公司growjo資料顯示,目前Soul Machines員工總數(shù)為222名,預(yù)估年收入為2600萬美元。
在上個月,這家公司宣布獲得7000萬美元的B1輪融資,由軟銀景愿基金領(lǐng)投。此前它的B輪投資是在2020年獲得的,共計4000萬美元。
一般來說,虛擬數(shù)字人從工作屬性可以分為兩種類型:服務(wù)型虛擬數(shù)字人以及身份型虛擬數(shù)字人。
首先說一下服務(wù)型虛擬數(shù)字人,它不要求顏值出眾,個性鮮明,它起到的更多是一種工具人的角色,通過運用AI語音等技術(shù),解決像客服、陪護之類重復(fù)性較高的工作,起到降本增效的作用。目前,Soul Machines主要發(fā)力點也是這一塊。
Soul Machines在零售、醫(yī)療、教育、金融等領(lǐng)域推出了相應(yīng)的虛擬數(shù)字人解決方案。目前跟它合作的客戶包含了雀巢、寶潔等知名企業(yè)。
2019年,Soul Machines幫助SK-II設(shè)計打造了虛擬護膚專家Yumi。Yumi就像是一個線上客服,不過它以擬人形象出現(xiàn)在你面前,你可以跟她聊天,提問護膚相關(guān)問題。
為什么要推出虛擬數(shù)字人,當時SK-II CEO Sandeep Seth在采訪中表示,相較于冰冷的文字客服,與虛擬數(shù)字人面對面溝通,能使消費者與企業(yè)間產(chǎn)生一種美妙的連接。當消費者需要護膚知識的時候,就能第一時間想到Y(jié)umi。
在Soul Machines官網(wǎng)中,它貼出了一張?zhí)摂M數(shù)字人給企業(yè)帶來的收益增長表,比如凈推薦值提高90%、與Yumi交流,購買可能性增加了一倍。
圖源:Soul Machines
而在衛(wèi)生保健等領(lǐng)域,虛擬數(shù)字人也產(chǎn)生了積極的作用,Soul Machines表示可以做到40%的客戶能夠在零人工干預(yù)情況下獲得解答。
圖源:Soul Machines
前面說完了服務(wù)型虛擬數(shù)字人,還有一種是身份型虛擬數(shù)字人,簡單來說就是我們常見的諸如柳夜熙、Imma等虛擬偶像。
目前Soul Machines并沒有涉及虛擬偶像領(lǐng)域。不過它有個臨近的業(yè)務(wù)稱之為數(shù)字雙胞胎,也就是幫助明星打造高還原度的虛擬數(shù)字人。
此前知名說唱歌手will.i.am就曾定制過它的數(shù)字雙胞胎。從一些視頻片段中可以看到,這個虛擬人物的建模精度很高,并且它的聲音以及神態(tài)都做了很好的還原。
官方表示這個虛擬數(shù)字人可以365天24小時全天候在線,就如同一個管家一樣,為粉絲解答一些諸如明星的出生年月日、身高體重等基本問題。此外,你也可以利用這個虛擬角色裝扮你的社交媒體。
不過,我個人感覺,數(shù)字雙胞胎服務(wù)還是挺雞肋的,因為它能提供的服務(wù)價值非常單薄。并且這種私人訂制服務(wù),成本也是一個邁不過去的坎。根據(jù)Uphonest Capital的數(shù)據(jù),僅僅制作單個高精度3D虛擬數(shù)字人形象,成本就已經(jīng)高達上百萬美元。
所謂數(shù)字雙胞胎,現(xiàn)階段,還只是一個小眾玩具。
好萊塢級別的特效
一個虛擬數(shù)字人交互體驗是否優(yōu)秀,主要涉及到三方面內(nèi)容:人物形象設(shè)計、語音交互以及肢體動作。
其中,人物形象設(shè)計涉及到了建模、驅(qū)動、渲染等一系列步驟。虛擬人物擬人化程度越高,相對而言實現(xiàn)效果也會更為出色。
人物設(shè)計是Soul Machines的核心優(yōu)勢之一。Soul Machines擁有先進的CGI以及自主動畫技術(shù)。它所打造的數(shù)字人,具有極高的細節(jié)還原度。
值得一提的是,Soul Machines的聯(lián)合創(chuàng)始人Mark Sagar,曾經(jīng)從事《阿凡達》以及《金剛》的面部設(shè)計工作。因為電影的出色表現(xiàn),他分別在2010以及2011年兩度獲得奧斯卡科技獎。
目前Soul Machines面向企業(yè)推出了一項名為Digital DNA Studio(數(shù)字DNA工作室)的服務(wù)。這個服務(wù)包里面內(nèi)置了一套面孔資源庫,你通過數(shù)字DNA工作室能快速創(chuàng)造出一個虛擬數(shù)字人形象。這項服務(wù)能夠大大簡化以往虛擬人物設(shè)計流程。
影響虛擬數(shù)字人的第二點是語言交互。語言交互是一個復(fù)雜的工程,里面又會涉及到NLP(自然語言處理)、TTS、AI等一系列技術(shù)。目前很多虛擬數(shù)字人企業(yè)會傾向于把NLP方案外包出去。從官網(wǎng)開發(fā)者文檔來看,估計Soul Machines也選擇了外包方案。
Soul Machines打造出了自家的虛擬數(shù)字人Viola,只要你登陸它們官網(wǎng),就可以跟Viola進行一番互動。它有點類似于一個擬人化的Siri,當你跟她交流的時候,她會回答你各種各樣的問題。
我試了一下,只能說體驗一般。它只能回答一些簡單的問題,比如說天氣、地理位置或者名詞解釋等等。如果問題稍微復(fù)雜一點,往往就無能為力了。
與Viola交流
說回最后一點,肢體動作。哪怕虛擬數(shù)字人造型逼真,并且語言輸出流暢,如果它在運動時肢體僵硬的話,還是會給人一種一眼假的感覺。
Soul Machines研發(fā)了一個專為虛擬數(shù)字人打造的Human OS 2.0系統(tǒng)。這個系統(tǒng)獲得了數(shù)字大腦相關(guān)專利。通過Human OS,虛擬數(shù)字人能夠作出更加自然的表情以及手勢動作。
此外,通過攝像頭,虛擬數(shù)字人還能夠捕捉到你的眼神以及部分表情,并且結(jié)合你的聊天內(nèi)容作出高興、激動等表情。
有意思的是,為了避免虛擬數(shù)字人給我們造成困擾,此前Soul Machines曾發(fā)了一條推文表示,為了讓虛擬數(shù)字人更好投入到工作中,已經(jīng)“閹割”掉了它們的憤怒,沮喪等負面情緒。不知道這算不算PUA的一種。
虛擬數(shù)字人的三個等級
總的來說,Soul Machines的虛擬數(shù)字人解決方案,尤其是在人物還原度這一塊,已經(jīng)處于行業(yè)領(lǐng)先水平。
目前,NLP技術(shù)薄弱,人工智能化程度低,制造成本過高,仍是限制虛擬數(shù)字人發(fā)展的重要因素之一。
就像是自動駕駛一樣,Soul Machines在它們的自主動畫框架中,也把虛擬數(shù)字人也劃分為了5個等級。
其中,等級1是最原始的,虛擬數(shù)字人的全部運作都需要人進行參與管理;2級的虛擬數(shù)字人,它可以通過腳本實現(xiàn)一些自動化操作;
從第三級別開始,虛擬人有了訓練算法的加持,能夠進行深度學習。它能夠表現(xiàn)出更強的自主性,人在其中的管控也會更加少。
如果我們將各大企業(yè)對號入座的話,就能夠發(fā)現(xiàn)目前絕大多數(shù)的虛擬數(shù)字人仍停留在第一或者第二級別的水平。大部分能歌善舞的虛擬偶像,其實只不過處在一級階段;而效率爆表的虛擬主播、數(shù)字員工等,也只在第二階段。
量子位的產(chǎn)業(yè)報告指出,2030年,我國虛擬數(shù)字人的整體市場規(guī)模將達到2700億。不知道那時候,虛擬數(shù)字人又會有怎么樣的進化,它給我們的生活又會帶來什么樣的變化呢?
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息