騰訊が最近発表した「混元 3D 世界モデル 1.0」は、業界初のオープンソースの没入型インタラクティブ世界生成モデルを示しています。これにより、ゲーム開発、バーチャルリアリティ、デジタルコンテンツ制作に革命的な影響を与えることになるでしょう。ユーザーは、簡単な一文や画像を介して、わずか数分で360度の没入型バーチャルワールドを生成することができます。これは、以前は専門のモデリングチームが数週間かけて行っていた作業が、今では手軽に実現できるようになったということです。
混元 3D 世界モデル 1.0の革新点は、その語意層次化3D場景表徵及生成アルゴリズムにあります。このアルゴリズムは、複雑な3D世界を階層的に分解し、前景と背景、地面と空のスマートな分離を実現します。これにより、視覚的に素晴らしい全体のシーンが生成されるだけでなく、標準化された3Dメッシュ資産を出力することができます。
このモデルは、パノラマビジュアル生成技術と階層型3D再構築技術を組み合わせており、テキストや画像の入力に対応しています。そのため、生成される3Dシーンは高品質でありながら、多様なスタイルを持っています。生成されたメッシュファイルは、Unity、Unreal Engine、Blenderなどの主要ツールと互換性があり、ユーザーは独自に編集したり物理シミュレーションを行ったりすることができます。これにより、AIGC技術と従来のCGワークフローをスムーズに接続することが可能です。
ゲーム開発者にとって、混元3D世界モデルは3Dシーン構築のプロセスを大幅に簡略化します。開発者は簡単なコマンドを入力するだけで、建物、地形、植生を含む完全な3Dシーンを迅速に生成できます。生成されたMeshファイルはゲームプロトタイプの構築やレベルデザインに利用でき、ユーザーは前景のオブジェクトを柔軟に調整したり、空の背景を変更したりすることで、個性的なクリエイションのニーズを十分に満たすことができます。
モデリング経験のない一般ユーザーでも、混元3Dクリエイティブエンジンを使用することで、1文や1枚の画像から迅速に360度の没入型ビジュアル空間を生成できます。これらの生成されたシーンは、Vision ProなどのVRヘッドセットにシームレスにインポートでき、全方位の没入体験を提供します。
グローバルで最先端のオープンソースモデルと比較した場合、混元 3D 世界モデル 1.0は、テキストから画像生成や画像から画像生成における美的品質や指示の遵守能力といった重要指標において、現在の最先端のオープンソース技術を超えています。このモデルのリリースは、テンセントが単一の3Dアセットを秒単位で生成するだけでなく、ワンクリックで探索可能な3D世界を作成して、完全な3Dコンテンツ生成エコシステムを段階的に構築していることを示しています。
現在、テンセントの混元大モデルは、画像、動画、3D、テキストといった全モダリティのオープンソース化を達成しました。画像と動画の派生モデルの数はそれぞれ1,400個と1,600個に達し、混元3Dシリーズモデルのダウンロード数は230万回を超え、世界で最も人気のある3Dオープンソースモデルの一つとして成功を収めています。



