智东西10月11日消息,据VentureBeat报道,北京大学、北京邮电大学和快手科技在本周联合开源了一款名为Pyramid Flow的高清视频生成模型。Pyramid Flow能根据文本描述制作长达10秒、分辨率为1280×768、每秒24帧的视频。 Pyramid Flow采用了金字塔流匹配算法,优化了视频 ...
北京大学、北京邮电大学和快手科技联合开发的Pyramid Flow模型,在文本生成视频领域取得了重大突破。本文将深入探讨这一模型的技术细节,解析其如何在效率和质量方面实现创新。 在仅56秒内生成5秒长的384p视频 这些性能指标不仅与当前顶级的全序列扩散模型 ...