然而,這款A(yù)I生成的“游戲”卻引發(fā)了廣泛的批評和爭議。

Oasis的畫面質(zhì)量令人失望,其分辨率僅為360p,幀率更是低至20FPS,甚至不及任天堂64時代的游戲。更為嚴(yán)重的是,該AI模型存在顯著的幻覺問題,導(dǎo)致游戲體驗極不穩(wěn)定。玩家無法進(jìn)行復(fù)雜操作,甚至在簡單的挖掘動作中,常常會被意外傳送回地面。此外,游戲環(huán)境中的物體缺乏持久性,玩家的建造成果無法保存。

Oasis是如何煉成的

之前谷歌推出的GameNGen本質(zhì)上仍是一個由AI驅(qū)動的游戲引擎,但Oasis的底層機(jī)制并不是游戲引擎,而是單一的視頻生成模型,相當(dāng)于一個能交互、可玩的Sora。

那么,Oasis究竟是如何做到的?

根據(jù)博客介紹,技術(shù)團(tuán)隊進(jìn)行了數(shù)百次架構(gòu)和數(shù)據(jù)實驗,以確定用于快速生成自回歸交互式視頻的最佳架構(gòu)。

Oasis模型均基于Transformer架構(gòu),由基ViT的變分自動編碼器(VAE)和基于DiT的潛在擴(kuò)散主干組成,使用了加速過的軸向、時空和因果注意力機(jī)制來克服長序列中的模型發(fā)散(divergence)。

Oasis的ViT+DiT架構(gòu)

VAE就像是工廠里負(fù)責(zé)整理和識別原材料(游戲里的各種信息)的車間,它基于ViT(Vision Transformer)架構(gòu),能夠?qū)吹降挠螒虍嬅娴南嚓P(guān)信息進(jìn)行加工整理。

主干即工廠的核心生產(chǎn)線,基于DiT(Diffusion Transformer)架構(gòu),負(fù)責(zé)將加工處理好的信息產(chǎn)出游戲內(nèi)容,比如游戲場景、物體等。

同時,利用Decart的推理引擎,結(jié)合Etched公司的Sohu(Transformer架構(gòu)的ASIC)芯片,實現(xiàn)了實時視頻生成。

這種架構(gòu)選擇保證了在Sohu芯片上的穩(wěn)定擴(kuò)展和快速推理,并且以自回歸方式生成幀,能夠根據(jù)游戲輸入實時交互。

Sora這類模型根據(jù)用戶輸入的文本內(nèi)容直出視頻,但Oasis使用Diffusion Forcing進(jìn)行訓(xùn)練,每次只生成一幀,根據(jù)游戲輸入在token級別調(diào)節(jié)每個幀,因此可操縱性很高。

之所以能夠被稱為「世界模型」,是因為Oasis已經(jīng)能夠了解復(fù)雜的游戲機(jī)制,例如理解物體和建筑、照明的物理規(guī)律等等。

1

模型理解照明的物理原理

2

放置立方體磚塊

兩家初創(chuàng),強(qiáng)強(qiáng)聯(lián)手

生成式交互體驗新紀(jì)元這就來了嗎?這兩家初創(chuàng)公司又是什么來頭?

據(jù)公開報道,Oasis模型是由Decart和Etched兩家初創(chuàng)公司共同推出的。

Decart成立于2023年9月,一直致力于提高AI模型的效率和降低運行成本,提供更快、更可靠的訓(xùn)練以及實時推理,成立三個月后便與一家GPU云服務(wù)商達(dá)成了數(shù)百萬美元的交易。

紅杉資本更是豪擲2100萬美金對其進(jìn)行了投資,合伙人Shaun Maguire更是大力稱贊Decart的團(tuán)隊,認(rèn)為他們是「超精英的AI工程師」、「合作過的技術(shù)最有天賦的團(tuán)隊之一」,正在將生成式體驗推向極致。

游戲體驗并不理想

但是Oasis的畫面質(zhì)量令人失望,其分辨率僅為360p,幀率更是低至20FPS,甚至不及任天堂64時代的游戲。不過,如果在Etched打造的Sohu芯片上運行 100B+參數(shù)的優(yōu)化模型,就能達(dá)到4K級別的實時渲染,并發(fā)用戶數(shù)量也將提升超過10x。

更為嚴(yán)重的是,該AI模型存在顯著的幻覺問題,導(dǎo)致游戲體驗極不穩(wěn)定。玩家無法進(jìn)行復(fù)雜操作,甚至在簡單的挖掘動作中,常常會被意外傳送回地面。此外,游戲環(huán)境中的物體缺乏持久性,玩家的建造成果無法保存。

盡管Oasis宣稱將開源代碼,但外界對其侵權(quán)行為表示質(zhì)疑。該項目使用了 OpenAI的Minecraft VPT數(shù)據(jù)集進(jìn)行訓(xùn)練,包含7萬小時的在線視頻數(shù)據(jù),其中大部分來自《我的世界》。這一點引發(fā)了對模型原創(chuàng)性的關(guān)注。

雖然許多AI愛好者認(rèn)為,將AI技術(shù)應(yīng)用于經(jīng)典游戲如《反恐精英:全球攻勢》和《毀滅戰(zhàn)士》是游戲領(lǐng)域的進(jìn)步,但對于大多數(shù)玩家而言,真正的游戲引擎和硬件設(shè)備依然是最可靠、高效的游戲體驗方式。AI生成的游戲雖然能模仿現(xiàn)有游戲的元素,但缺乏深度與原創(chuàng)性。

Oasis的推出再次凸顯了AI技術(shù)在游戲領(lǐng)域面臨的挑戰(zhàn)。盡管AI可以生成一些簡單的游戲元素,但要創(chuàng)造出真正復(fù)雜、原創(chuàng)的游戲,仍然需要人類的創(chuàng)意和技術(shù)。

結(jié)語

總的來說,Decart AI推出的Oasis模型具有實時生成與交互、架構(gòu)優(yōu)勢、創(chuàng)新訓(xùn)練方法等特點,為游戲領(lǐng)域帶來了全新的體驗。雖然目前畫面質(zhì)量和用戶體驗還有待提升,但其市場前景廣闊,有望在未來的游戲開發(fā)中發(fā)揮重要作用。讓我們拭目以待,看看視頻生成模型領(lǐng)域接下來還會帶給我們哪些驚喜與突破。(文/宋雨涵)

分享到

lixiangjing

算力豹主編

相關(guān)推薦