AI的下半場,“AI教母”李飛飛打響第一槍快訊
Marble的首批應用場景將聚焦于游戲開發、電影視覺特效和虛擬現實三大領域,實現影院級渲染效果 在生成式AI領域,同時支持用戶將生成的世界以高斯濺射、網格或視頻等多種工業級格式導出。
一句話,生成一個3D宇宙——這個科幻場景,今天實現了。
“AI教母”李飛飛創辦的World Labs,剛剛發布了其首款商業化世界模型產品Marble。
它徹底改變了3D世界的創作方式:用戶只需上傳照片、視頻或輸入文本,就能快速生成可編輯、可下載的虛擬環境,并已全面兼容Vision Pro和Quest 3。
這不僅是游戲開發者和電影特效師的福音,更預示著AI正從理解語言,邁向理解物理世界的全新紀元。
··
Marble的“魔法”究竟有多強?一鍵生成3D宇宙
Marble的正式亮相,瞬間讓World Labs在世界模型領域的競爭中搶占了領先地位。
這款在兩個月前首度以限量測試版形式亮相的產品,展現出與同行截然不同的技術路徑。當Decart、Odyssey等初創公司還在“小打小鬧”地推出免費演示版,谷歌的Genie也只在有限研究預覽階段“猶抱琵琶半遮面”時,Marble已經實現了商業化落地。
它的核心技術突破在于能夠創建“持久化”、可下載的3D環境,這與那些在用戶探索時實時動態生成的虛擬世界有著本質區別。World Labs聯合創始人賈斯汀·約翰遜(Justin Johnson)指出,這種技術路徑能有效減少場景形變和畫面不一致的現象,同時支持用戶將生成的世界以高斯濺射、網格或視頻等多種工業級格式導出。
據World Labs官方介紹,Marble通過生成規模更大、風格更多元、3D幾何結構更清晰的世界,實現了對前代模型的跨越式升級。
輸入靈活,細節逼真到“毛孔”
Marble在輸入方式上展現出卓越的靈活性。無論是場景描述、圖像素材、真實環境視頻片段,還是粗略的3D布局,都能作為生成素材的“引子”。它不僅支持從單條文本提示或單張圖像生成世界,更能通過接收多角度圖像或短視頻作為輸入,構建高度逼真的數字孿生環境。
World Labs去年展示的早期模型雖然已實現了從單張圖像生成交互式3D場景的突破,但仍存在畫面略顯卡通、移動范圍受限和偶發渲染錯誤等局限。而在正式版Marble的測試體驗中,僅憑圖像提示就能生成從游戲場景到真實客廳復刻的多種虛擬環境,其細節還原度簡直令人驚嘆!
約翰遜透露,盡管測試版在場景邊緣處理上曾有改進空間,但據說正式版已對此進行了優化。更有趣的是,測試期間使用單一提示生成的世界,在視覺效果和意圖匹配度上反而展現出獨特優勢,這讓人對正式版的表現充滿期待。
·AI原生編輯,混合3D創作“零門檻”
作為同類產品中的首創,Marble集成了AI原生編輯工具和名為Chisel的混合3D編輯器。用戶可以先勾勒出粗略的空間布局(如墻體、立方體或平面),再通過文本提示定義視覺風格,最后由AI智能填充細節。這種將結構與樣式分離的工作流程,就像用HTML定義網站架構,再用CSS控制視覺呈現一樣,思路清晰又高效。 與傳統基于文本的編輯方式不同,Chisel支持用戶直接操控3D物體,例如直接抓取代表沙發的3D方塊并將其移動到任意位置,從而實現了無需代碼的直觀可視化編輯。
·無限擴展,融合創新
World Labs新引入的“世界擴展”功能顯著提升了編輯的自由度。約翰遜解釋道:“生成世界后,用戶可以進行一次擴展操作。當遇到場景開始模糊的區域時,可以指令模型在該區域進行擴展或增添細節。”
針對超大規模空間的創作需求,Marble的“組合模式”(composer mode)支持多個世界的無縫融合。約翰遜在現場演示中,將風格迥異的“奶酪房間配葡萄椅”與“太空未來會議室”兩個世界進行了完美拼接。該系統能夠基于現有規則和風格自動生成延展的3D空間,確保世界擴展的風格統一性,讓你的虛擬宇宙想多大就有多大!
·高斯濺射:實現影院級渲染效果
在生成式AI領域,高斯濺射(Gaussian Splatting)被視為渲染3D對象和空間的高品質標準。Marble通過生成數百萬甚至數十億個微小的“濺射點”,這些分布在3D空間不同位置的半透明粒子,以其中心為最大值,按照鐘形曲線平滑遞減至邊緣為零的分布方式,精準模擬了物體的亮度、不透明度、顏色和密度等光學特性。
當數量龐大的濺射點相互重疊連接時,就能夠以令人驚嘆的精度近似模擬3D場景中的光滑表面、豐富色彩和復雜光照效果。這種渲染技術不僅創造了平滑一致的視覺體驗,更是圖形專業人士熟悉的工業級標準格式,分分鐘讓你的作品達到電影大片水準!
·多元風格,自由創作,想象力就是極限
模型支持生成包括卡通、科幻、未來主義、奇幻、動漫、寫實,以及復古低多邊形在內的多種藝術風格。特別值得一提的是,其復古風格能夠精準還原老式計算機渲染特有的“低畫質”視覺效果,為懷舊游戲和復古藝術創作提供了強大工具。想創建什么風格的世界,Marble 都能滿足你!
顛覆千行百業?Marble的“野心”有多大?
約翰遜闡明了產品的核心定位:“Marble未來的主題是‘創意控制’。我們既要保留快速生成的便捷性,更要賦予用戶深度掌控創作細節的能力。我們不希望機器完全接管創作過程,剝奪用戶的創造力。”
他明確表示,Marble的首批應用場景將聚焦于游戲開發、電影視覺特效和虛擬現實三大領域。
·游戲開發:賦能而非替代
開發者可以使用Marble生成背景環境,再將獲得的3D資產導入Unity或虛幻引擎等主流游戲開發平臺,繼續添加交互邏輯與程序代碼。“它并非要取代現有的游戲開發流程,而是作為現有流程的補充,提供可直接嵌入工作流的素材資源,”他特別強調。Marble 能夠輸出完整的3D 世界數據,其他創作者可以基于這些基礎進行二次開發或效果增強,例如將生成的三角網格直接應用于游戲場景構建。
盡管近期有游戲開發者大會的調查顯示,業內對生成式AI的負面評價有所上升,主要擔憂集中在知識產權、能耗問題和生成內容質量等方面,但Marble堅持“工具賦能”而非“完全替代”的定位,或許能為這些擔憂提供新的解決思路。
·影視特效:精準控制的突破
在電影視覺特效領域,Marble能夠有效規避傳統AI視頻生成器常見的畫面不穩定與鏡頭控制難題。藝術家可以借助其生成的3D資產進行精確的場景布置,實現幀級別的精度的鏡頭控制。比如,特效團隊可以獲取高斯濺射數據,直接用于特效鏡頭的合成制作,大大提升效率和質量。
·虛擬現實:即時生成
雖然World Labs目前并未將虛擬現實作為重點發展方向,但約翰遜坦言該行業正面臨“內容饑渴”的現狀,并對Marble 的發布表現出濃厚興趣。目前,Marble 已全面兼容Vision Pro和Quest 3等主流VR設備,所有生成的世界都可以立即通過VR頭顯進行沉浸式體驗。
·機器人訓練:構建仿真環境
此外,在機器人技術領域,Marble也展現出獨特潛力。約翰遜稱,機器人技術領域一直缺乏大規模訓練數據庫,而Marble這類世界生成器能夠便捷地構建仿真訓練環境,為開發自動駕駛車輛和機器人等AI系統提供大量逼真的訓練數據。
·更廣闊的應用前景:科研、醫療、教育
李飛飛進一步展望了該技術的長遠影響。她指出,這類技術未來將在實驗模擬、藥物研發和沉浸式學習等科學與醫學領域展現價值。
同時,她深信“空間智能將徹底改變我們創建和交互虛實環境的方式”,為敘事藝術和整個創意產業帶來革命性變革。可以想象,未來我們閱讀小說時,也許可以直接生成一個3D 場景來體驗故事!
訂閱模式與生態展望:誰將成為先行者?
Marble提供四檔訂閱方案,從免費版到每月95美元的旗艦版不等,讓不同需求的用戶都能找到適合自己的選擇。
免費版: 支持4次文本/圖像/全景生成
標準版: 20美元/月,提供12次生成次數,支持多圖像/視頻輸入及高級編輯。
專業版: 35美元/月,提供25次生成次數,含場景擴展及商業授權
旗艦版: 95美元/月,提供75次生成次數和完整功能集,全功能解鎖
為追求其空間智能的愿景,World Labs已籌集2.3億美元資金,投資方可謂“眾星云集”,包括Radical Ventures、Andreessen Horowitz和英偉達等頂級風投,以及杰弗里·辛頓(Geoffrey Hinton)、埃里克·施密特(Eric Schmidt)、馬克·貝尼奧夫(Marc Benioff)和里德·霍夫曼(Reid Hoffman)等科技界領袖。
目前全球范圍內已有多個團隊致力于世界模型研發,包括谷歌的Genie、英偉達的Cosmos以及AI初創公司Decart。值得關注的是,Meta首席AI科學家楊立昆(Yann LeCun)據傳也在為其世界模型初創項目進行早期融資,預示著這場“空間智能”的競賽將異常激烈。
Marble的發布,不僅是World Labs的里程碑,更是AI邁向真正理解和與物理世界交互的重要一步。正如李飛飛所言:“空間智能將改變我們創建和與現實及虛擬世界互動的方式——徹底改變敘事、創意、機器人技術、科學發現及其他領域,這將是AI的下一片前沿!”(小小)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。
