騰訊最近推出的混元 3D 世界模型 1.0,標誌著業界首個開源的沉浸式互動世界生成模型,相信將對遊戲開發、虛擬現實及數碼內容創作帶來顛覆性的影響。用戶僅需透過簡單的一句話或一張圖片,就能在短短幾分鐘內生成360度沉浸式虛擬世界,這以前需要專業建模團隊數週時間才能完成的任務,如今已可輕鬆實現。
混元 3D 世界模型 1.0 的創新之處在於其「語意層次化 3D 場景表徵及生成算法」。此算法能有效將複雜的3D世界進行層次分解,實現前景和背景以及地面和天空的智能分離,不僅生成出視覺效果令人驚艷的整體場景,更可以輸出標準化的 3D Mesh 資產。
該模型結合了全景視覺生成技術與分層 3D 重建技術,支援文字和圖片的輸入,確保生成的3D場景不僅高品質還具備多樣化風格。生成出來的 Mesh 檔案可與 Unity、Unreal Engine、Blender 等主流工具兼容,使用者可獨立編輯或進行物理仿真,順暢衔接 AIGC 技術與傳統 CG 工作流程。
對於遊戲開發者來說,混元 3D 世界模型相當於簡化了3D場景構建的整個過程。開發者只需輸入簡單的指令,模型便能迅速生成包括建築、地形及植被的完整3D場景。生成的 Mesh 檔案可用於遊戲原型搭建或關卡設計,且使用者能靈活調整前景物體或更換天空背景,充分滿足個性化創作的需求。
即使是沒有建模經驗的普通用戶,只要透過混元 3D 創作引擎,便能以一句話或一張圖快速生成360度的沉浸式視覺空間。這些生成的場景能無縫導入到如 Vision Pro 等虛擬頭顯中,帶來全方位的沉浸式體驗。
在與全球最領先的開源模型比較中,混元 3D 世界模型 1.0在以文字生圖及以圖生圖的美學品質及指令遵循能力等關鍵指標上,均超越了目前的最先進開源技術。這一模型的發佈,表明騰訊不僅能實現秒級生成單個3D資產,更推進至一鍵即製作可漫遊的3D世界,逐步構建完整的3D內容生成生態。
目前,騰訊的混元大模型已達成圖像、影片、3D及文本等全模態的開源。圖像和影片的衍生模型數量達到 1,400 個和 1,600 個,並且混元 3D 系列模型的下載量已超過 230 萬次,成功建立為全球最受歡迎的3D開源模型之一。


