近日,Decart AI推出的AI我的世界模型Oasis迅速在網絡上走紅。一些用Oasis生成的大約四五分鐘的MC遊玩視頻獲得了幾十萬的播放量,引發了廣泛的討論,連籽岷也發佈了對它的介紹視頻。
從心率看得出來岷叔是真激動了
Oasis生成的MC世界,大致上看起來是這樣的:
oasis生成的詭異生物
不停變化的放置物
Oasis提供360p、20FPS、單次限時5分鐘的可交互遊戲體驗,玩家可以在其中完成行走、挖掘、使用物品等所有的MC操作。支持這一切的並非什麼遊戲引擎,而只是一個AI模型。
從上面的演示可以看出,這個由人工智能生成的遊戲世界並不穩定,雖然大體上模擬出了MC的遊戲機制,但每分每秒都在發生詭異的變化,爲本就有些微恐色彩的MC增添了些許獵奇意味。這個AI還有着無記憶性的特點,不會記住離開畫面的內容,稍微改變一下視角,便可能來到一個完全不同的世界。筆者在遊玩時甚至眼睜睜地看着水面變成了冰面,而後又從萬米高空直墜而下,簡直令人頭暈目眩。
Oasis網址:OASIS(手機也可以體驗)
“是非成敗轉頭空,青山依舊在,幾度夕陽紅?”
或許正是因爲這種不確定性,儘管畫質差強人意,Oasis還是吸引了大量玩家的關注。同時,非線性的遊玩體驗也對玩家的大腦提出了強勁挑戰。有人笑稱,“AI首次擁有了對人類進行精神污染的能力”。不少玩家表示體驗後暈了3D,有嚴重者甚至不自覺地把遊戲的生成邏輯帶到了現實中,總感覺一轉頭身邊的事物就要發生變化,眼前的文字下一秒就要開始扭曲,引發了相當不快的“現實解離”體驗。正是因此Decart才限制單次遊玩時間不超過五分鐘,以防對玩家造成嚴重的精神傷害。不過,一般來說這種感覺緩個十幾分鍾就會消散,敏感人羣則可能需要更長時間來恢復。
或許你會對這個奇特的模型的原理感到好奇。據開發者介紹,Oasis使用OpenAI收集的開源Minecraft視頻數據集進行訓練。模型依託ChatGPT同款Transformer架構,分爲基於視覺變換器(Vision Transformer, ViT)的變分自編碼器(Variational Autoencoder, VAE)和擴散變換器(Diffusion Transformer, DiT)兩部分。
官網提供的結構圖
圖像先是經由ViT-VAE編碼器的初步處理,再輸入給DiT模塊,DiT根據玩家的鍵鼠輸入和模型訓練所得預測畫面會如何變化,生成新的圖像數據,最後傳至ViT-VAE解碼器得到預測的下一幀圖像。
此外Oasis還引入了動態噪聲來消除畫面中小缺陷經過長時間後造成的複合錯誤,這也是爲什麼在遊玩過程中不時會看到一些模糊不清的線條的原因。
在運行上,Oasis使用了合作開發公司Etched研發的AI芯片Sohu。Sohu專爲加速Transformer架構的人工智能模型設計,在該方面的性能遠超英偉達的H100芯片。得益於此,Oasis支持大量玩家同時在線遊玩。
官網發佈的性能對比
Oasis無疑是在Google的GameNGen之後生成式AI在遊戲領域的又一重大進展。然而我們不禁要問,生成式的遊戲,真的有未來嗎?
就Oasis本身而言,它的遊戲體驗並不好。畫質低、幀數少,這些問題在未來或許都能被解決。真正的問題出在它本身的Transformer架構上。
本質上,Transformer擅長的是預測,而非精確的計算和建模,強如ChatGPT也要犯9.9<9.11的笑話。要克服潛在的幻覺問題使AI生成的遊戲真正可玩,可能還有好長一段路要走。或許Oasis的開發者有信心解決這些問題,也有可能開發Oasis只是一種商業策略,通過生成式遊戲的噱頭吸引人們的關注,爲sohu芯片贏得更多的支持(要知道,Etched可是向英偉達發起挑戰的存在)。
當然,人工智能的發展日新月異,誰也不敢斷言AI就不能克服缺陷,生成真正的遊戲。
不過,Oasis生成的MC世界的風格倒是讓我想起了一類遊戲。沒錯,就是怪核(Weirdcore)風格的遊戲。
怪核是近些年來新興的一種美學風格。它通常使用低分辨率的圖片、失真的文字、復古電腦圖形、詭異的幾何構圖、和模糊的場景來營造一種超現實和異化的感覺,旨在引發觀衆的不確定感和一種彷彿處於夢境、熟悉但又陌生的空間中的體驗。典型的例子就是以後室(backrooms)爲題材的遊戲。
backrooms
在這類遊戲中,精密計算的需求大大減弱,重要的是爲玩家提供奇特的感受。這時,Oasis缺乏邏輯、風格詭異的特點反而變成了優勢。只要稍微增加一點記憶功能,輔以大量的數據訓練,生成式AI沒準真能做出別具一格的怪核遊戲。
至於未來生成式AI究竟會帶給我們什麼樣的遊戲體驗,就讓我們拭目以待吧。
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com