资讯

正是基于这种相似性, 基因组语言模型 (gLMs)应运而生。这类模型能够有效捕捉DNA序列中具有生物学意义的特征模式,从而为 深入理解人类全基因组调控机制、解析遗传变异致病性以及推动治疗发现 提供了新的研究范式。
实验结果表明,SPACE模型在18项任务中的11项上取得了当前最佳(SOTA)性能,显著优于包括DNABERT-2、HyenaDNA以及NT系列在内的无监督预训练模型,也一致性地超越了其监督学习的基线模型Enformer。