本文主要分享我们近期在Embedding模型训练上的工作「Conan-Embedding」。目前,Conan-Embedding已在最全面、最大规模的中文语义向量评测榜单C-MTEB上达到SOTA,超越了阿里、百川、OpenAI等众多Embedding模型。 随着大模型时代的爆发,检索增强生成技术(RAG)在大语言模型 ...
一、Next-Embedding Prediction的研究动机 Next-embedding prediction《Next-Embedding Prediction Makes Strong Vision Learners》一文,是2025年12月份发布于arXiv上的一篇文章。 Next-X ...