资讯
1 天
科技行者 on MSN让大型AI模型减肥变身,马普所等机构打造"瘦身"版训练新方法这项由德国马普所智能系统研究所的邱泽驹、刘维阳等研究者领导的研究发表于2025年6月的arXiv预印本平台,论文编号为arXiv:2506.19847v1。有兴趣深入了解的读者可以通过spherelab.ai/oftv2访问完整论文和相关资源。 当下的人工智能世界正面临着一个有趣的矛盾:AI模型变得越来越聪明,但也变得越来越"胖"。这些动辄几十亿甚至上千亿参数的大型模型,就像是住在豪华别墅里的巨人 ...
来自MSN18 小时
华为首个开源大模型来了!Pro MoE 720亿参数,4000颗昇腾训练代码生成方面, 在MBPP+(Pass@1)的指标达到80.2,与Qwen3-32B(82.0)处于同一性能区间。数学推理任务中,MATH-500测试以96.8分超越Qwen3-32B(96.6),CNMO2024基准Pass@1指标70.8亦较后者(70.4)提升0.4分。特别在 SuperGPQA复杂问题解答基准中,54.8 的Pass@1 得分显著优于 GLM-Z1 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果