GitHub Unity Collab - 搜索 News

HuMo: Human-Centric Video Generation via Collaborative Multi-Modal Conditioning

HuMo is a unified, human-centric video generation framework designed to produce high-quality, fine-grained, and controllable human videos from multimodal inputs—including text, images, and audio. It ...

GitHub

SpatialGen: Layout-guided 3D Indoor Scene Generation

TL;DR: Given a 3D semantic layout, SpatialGen can generate a 3D indoor scene conditioned on either a reference image (left) or a textual description (right) using a multi-view, multi-modal diffusion ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

HuMo: Human-Centric Video Generation via Collaborative Multi-Modal Conditioning

SpatialGen: Layout-guided 3D Indoor Scene Generation

今日热点