推廣

最新資訊

僅使用自然語言，開發(fā)者通過ChatGPT生成AR應(yīng)用ChatARKit

發(fā)布時(shí)間：2023-01-03 12:29 | 標(biāo)簽： ChatGPT OpenAI ChatARKit

微信掃一掃：分享

微信里點(diǎn)“發(fā)現(xiàn)”，掃一下
二維碼便可將本文分享至朋友圈

編譯/VR陀螺

自12月初以來，人們一直在探索OpenAI推出的對(duì)話AI ChatGPT神經(jīng)網(wǎng)絡(luò)的深度。近日，一位開發(fā)者讓這款對(duì)話AI吐出了可以工作的AR代碼。

OpenAI的ChatGPT對(duì)話AI被優(yōu)化為生成文本和回答問題。但12月初的初步測(cè)試很快表明，該系統(tǒng)不僅僅能回答幾個(gè)措辭整齊的句子，還能回答編程代碼。

由ChatGPT生成的AR應(yīng)用ChatARKit

開發(fā)者Bart Trzynadlowski想知道他是否能用ChatGPT開發(fā)一個(gè)AR應(yīng)用，只用語音命令就能自主地在環(huán)境中放置數(shù)字3D物體。他還使用OpenAI的人工智能模型Whipser來識(shí)別語音命令，然后將它們作為人工智能提示帶入ChatARKit應(yīng)用的JavaScript環(huán)境。

圖源：Bart Trzynadlowski

因此，ChatGPT能從Sketchfab中選擇符合語音命令的3D物體，并根據(jù)提示將它們放在桌面或地板上。如果提示它，ChatGPT甚至可以縮放和旋轉(zhuǎn)3D模型。人工智能系統(tǒng)會(huì)自行生成這方面的代碼。

據(jù)Trzynadlowski表示，這些是一些有效的提示樣本：

"在最近的平面上放置一個(gè)立方體"。
"將一個(gè)旋轉(zhuǎn)的立方體放在地板上。"
"把一輛跑車放在桌子上并旋轉(zhuǎn)90度"。
"把一輛校車放在最近的平面上，讓它沿著平面來回行駛。"

根據(jù)Trzynadlowski的說法，ChatGPT的工作并不可靠。對(duì)于相同的命令，人工智能模型會(huì)產(chǎn)生非常不同的輸出，并在應(yīng)用程序中放置不正確的JavaScript代碼行。有時(shí)，ChatGPT會(huì)將對(duì)象描述變成代碼標(biāo)識(shí)符，這意味著無法再從Sketchfab檢索到3D模型。

Trzynadlowski在Github上將他的ChatGPT AR應(yīng)用作為開放源代碼免費(fèi)提供。

用自然語言在VR中生成3D物體

對(duì)于VR，開發(fā)者Jasmine Roberts最近展示了OpenAI新的3D人工智能Point-E，像圖像人工智能DALL-E 2一樣，它可以完全基于文本輸入生成內(nèi)容。然而，Point-E生成的不是圖像，而是代表三維模型的三維點(diǎn)云。每次生成，Point-E在單個(gè)Nvidia V100 GPU上只需要大約一到兩分鐘。值得一提的是，Roberts的演示是實(shí)時(shí)運(yùn)行的。

Point-E是OpenAI在文本轉(zhuǎn)3D合成方面進(jìn)一步工作的起點(diǎn)。谷歌與Dreamfusion，以及Nvidia與Magic3D最近也推出了文本轉(zhuǎn)3D系統(tǒng)，這可能在未來3D內(nèi)容的進(jìn)一步傳播中發(fā)揮重要作用，而這也是元宇宙理論的一個(gè)重要基礎(chǔ)。

來源：mixed-news

投稿/爆料：tougao@youxituoluo.com

稿件/商務(wù)合作：六六（微信 13138755620）

加入行業(yè)交流群：六六（微信 13138755620）