腾讯最近推出的混元3D世界模型1.0,标志着业内首个开源沉浸式互动世界生成模型,相信将对游戏开发、虚拟现实及数字内容创作带来颠覆性的影响。用户只需通过简单的一句话或一张图片,就能在短短几分钟内生成360度沉浸式虚拟世界,这以前需要专业建模团队数周时间才能完成的任务,如今已可轻松实现。
混元 3D 世界模型 1.0 的创新之处在于其 语义层次化 3D 场景表征及生成算法。这个算法能够有效地将复杂的 3D 世界进行层次分解,实现前景与背景、地面与天空的智能分离。不仅生成出视觉效果令人惊艳的整体场景,还可以输出标准化的 3D Mesh 资产。
该模型结合了全景视觉生成技术与分层 3D 重建技术,支持文字和图片的输入,确保生成的 3D 场景不仅高品质还具备多样化风格。生成出来的 Mesh 文件可与 Unity、Unreal Engine、Blender 等主流工具兼容,用户可独立编辑或进行物理仿真,顺畅衔接 AIGC 技术与传统 CG 工作流程。
对于游戏开发者来说,混元 3D 世界模型大大简化了 3D 场景构建的整个过程。开发者只需输入简单的指令,模型便能快速生成包括建筑、地形及植被的完整 3D 场景。生成的 Mesh 文件可用于游戏原型搭建或关卡设计,用户还能灵活调整前景物体或更换天空背景,充分满足个性化创作的需求。
即使是没有建模经验的普通用户,只要通过混元 3D 创作引擎,就能通过一句话或一张图快速生成360度的沉浸式视觉空间。这些生成的场景可以无缝导入到如 Vision Pro 等虚拟头显中,带来全方位的沉浸式体验。
在与全球最领先的开源模型比较中,混元 3D 世界模型 1.0 在以文字生图及以图生图的美学品质和指令遵循能力等关键指标上,均超越了目前的最先进开源技术。这个模型的发布,表明腾讯不仅能实现秒级生成单个3D资产,更推进至一键制作可漫游的3D世界,逐步构建完整的3D内容生成生态。
目前,腾讯的混元大模型已实现图像、视频、3D及文本等全模态的开源。图像和视频的衍生模型数量分别达到1400个和1600个,混元3D系列模型的下载量已超过230万次,成功建立为全球最受欢迎的3D开源模型之一。



