资讯

Meta和罗切斯特大学的研究团队提出了一种名为"BinauralFlow"的全新解决方案,这是一种基于流匹配模型(Flow Matching Models)的双耳语音合成框架,不仅能生成高质量的双耳音频,还支持流式推理,让音频合成过程能够实时连续进行 ...