资讯

这项由德国马普所智能系统研究所的邱泽驹、刘维阳等研究者领导的研究发表于2025年6月的arXiv预印本平台,论文编号为arXiv:2506.19847v1。有兴趣深入了解的读者可以通过spherelab.ai/oftv2访问完整论文和相关资源。 当下的人工智能世界正面临着一个有趣的矛盾:AI模型变得越来越聪明,但也变得越来越"胖"。这些动辄几十亿甚至上千亿参数的大型模型,就像是住在豪华别墅里的巨人 ...
代码生成方面, 在MBPP+(Pass@1)的指标达到80.2,与Qwen3-32B(82.0)处于同一性能区间。数学推理任务中,MATH-500测试以96.8分超越Qwen3-32B(96.6),CNMO2024基准Pass@1指标70.8亦较后者(70.4)提升0.4分。特别在 SuperGPQA复杂问题解答基准中,54.8 的Pass@1 得分显著优于 GLM-Z1 ...