当主流大语言模型还在采用自回归架构时,有人已经盯上了扩散架构。 在本次量子位MEET2026智能未来大会上,浙江大学百人计划研究员、博士生导师,蚂蚁集团资深技术专家赵俊博表示: 扩散架构在推理过程中可以直接修改和控制token,而不需要像自回归模型 ...