Diffusion Language Model

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

腾讯微信 AI 团队提出 WeDLM（WeChat Diffusion Language Model），通过在标准因果注意力下实现扩散式解码，在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速，低熵场景更可达 10 倍以上，同时保持甚至提升生成质量。引言自回归（AR）生成是当前大语言 ...

腾讯网

通用的dLLM开发框架，让BERT掌握扩散式对话

扩散式语言模型（Diffusion Language Model, DLM）虽近期受关注，但社区长期受限于（1）缺乏易用开发框架与（2）高昂训练成本，导致多数 DLM 难以在合理预算下复现，初学者也难以真正理解其训练与生成机制。为此，伯克利与 UIUC 团队基于自研的扩散语言模型工具 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

通用的dLLM开发框架，让BERT掌握扩散式对话

今日热点