編譯/VR陀螺
自12月初以來,人們一直在探索OpenAI推出的對話AI ChatGPT神經網絡的深度。近日,一位開發(fā)者讓這款對話AI吐出了可以工作的AR代碼。
OpenAI的ChatGPT對話AI被優(yōu)化為生成文本和回答問題。但12月初的初步測試很快表明,該系統(tǒng)不僅僅能回答幾個措辭整齊的句子,還能回答編程代碼。
由ChatGPT生成的AR應用ChatARKit
開發(fā)者Bart Trzynadlowski想知道他是否能用ChatGPT開發(fā)一個AR應用,只用語音命令就能自主地在環(huán)境中放置數字3D物體。他還使用OpenAI的人工智能模型Whipser來識別語音命令,然后將它們作為人工智能提示帶入ChatARKit應用的JavaScript環(huán)境。
圖源:Bart Trzynadlowski
因此,ChatGPT能從Sketchfab中選擇符合語音命令的3D物體,并根據提示將它們放在桌面或地板上。如果提示它,ChatGPT甚至可以縮放和旋轉3D模型。人工智能系統(tǒng)會自行生成這方面的代碼。
據Trzynadlowski表示,這些是一些有效的提示樣本:
根據Trzynadlowski的說法,ChatGPT的工作并不可靠。對于相同的命令,人工智能模型會產生非常不同的輸出,并在應用程序中放置不正確的JavaScript代碼行。有時,ChatGPT會將對象描述變成代碼標識符,這意味著無法再從Sketchfab檢索到3D模型。
Trzynadlowski在Github上將他的ChatGPT AR應用作為開放源代碼免費提供。
用自然語言在VR中生成3D物體
對于VR,開發(fā)者Jasmine Roberts最近展示了OpenAI新的3D人工智能Point-E,像圖像人工智能DALL-E 2一樣,它可以完全基于文本輸入生成內容。然而,Point-E生成的不是圖像,而是代表三維模型的三維點云。每次生成,Point-E在單個Nvidia V100 GPU上只需要大約一到兩分鐘。值得一提的是,Roberts的演示是實時運行的。
Point-E是OpenAI在文本轉3D合成方面進一步工作的起點。谷歌與Dreamfusion,以及Nvidia與Magic3D最近也推出了文本轉3D系統(tǒng),這可能在未來3D內容的進一步傳播中發(fā)揮重要作用,而這也是元宇宙理論的一個重要基礎。
來源:mixed-news
投稿/爆料:tougao@youxituoluo.com
稿件/商務合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
元宇宙數字產業(yè)服務平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息