腾讯(Tencent)推出并开源混元3D世界模型2.0(HY‑World 2.0),面向文字、图片与视频输入构建统一的空间理解与生成体系,可在一次推理中完成3D世界的生成、重建与模拟。模型支持Mesh、3DGS与点云等多种资产格式输出,可直接导入Unity、Unreal等引擎进行编辑,用于快速搭建地图与关卡原型。

与此前只能生成视频内容的版本不同,2.0能够输出可二次编辑的3D资产文件,生成结果可在游戏制作与具身仿真场景中直接使用。模型架构经过全面升级,画面精细度与空间一致性提升,输入文本或单张图片即可生成可漫游的三维场景,风格可按需求切换为写实、漫画或游戏方向。

模型提供角色模式,生成的场景具备物理碰撞,可在街道与建筑间自由移动。系统还支持从真实空间的视频或多视角图像重建数字孪生环境,基于WorldMirror 2.0架构预测点云、深度图、法线与相机参数,生成结果可长期复用,适用于室内设计、城市规划与文化遗产数字化等场景。
在同类世界模型中,混元世界模型2.0在场景完整度与对输入图像的还原度上表现更高。3DGS与Mesh的混合表征方式使角色模式具备更稳定的交互体验。目前,该模型已在腾讯混元3D创作引擎官网上线,用户可提交申请使用。