本文提出了一种创新的层次化编码器驱动掩码自编码器(Hi-End-MAE),通过编码器驱动重建和层次密集解码两大核心机制,显著提升了视觉Transformer(ViT)在医学图像分割任务中的表征能力。该方法在10K CT扫描数据上预训练,并在九个公共医学分割基准测试中展现 ...