红板报 on MSN2 天
从零复现,全面开源:360 Light-R1-14B/7B带来端侧AI平权时刻性能领先、开源普惠、国产易获取的三重势能,造就了年初DeepSeek的技术平权狂热,掀起AI普惠浪潮。
红板报 on MSN3 天
AI能自主出“竞赛题”了!港大&蚂蚁让大模型学会生成难题,水平已 ...赵学亮 投稿量子位 | 公众号 QbitAI 大模型架构研究进展太快,数据却快要不够用了,其中问题数据又尤其缺乏。 为此,港大和蚂蚁的研究人员反向利用思维链,提出了PromptCoT方法,并基于Llama3.1-8B训练了一个问题生成模型。 实验结果表明,合成的问题难度较开源数据和已有算法有显著提升,接近了AIME水平。 研究团队利用问题生成模型构造了400k SFT数据。 基于这份数据,团队训练 ...
红板报 on MSN5 天
砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术腾讯AI Lab 投稿量子位 | 公众号 QbitAI 只要微调模型生成的前8-32个词,就能让大模型推理能力达到和传统监督训练一样的水平? 腾讯AI ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果