AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:liyazhou ...
据TechCrunch,这个训练过程消耗了不到50美元的云计算成本,约合人民币364.61元;而s1模型作者之一表示,训练s1所需的计算资源,在当下约花20美元(约145.844元)就能租到。
据 TechCrunch ,这个训练过程消耗了不到50美元的 云计算 成本,约合人民币364.61元;而s1模型作者之一表示, 训练s1所需的计算资源,在当下约花20美元(约145.844元)就能租到 。
2月6日,据外媒报道,李飞飞等研究人员用不到50美元和16张英伟达H100 GPU,耗时26分钟训练出s1-32B人工智能推理模型。据外界分析,该模型基于预训练模型微调,成本未涵盖前期“烧钱”部分,且只在特定测试集上超过o1-preview,未超过“满血版”o1和DeepSeek-R1。在“白菜价”的背后,李飞飞团队重点研究了如何以简单方式实现“测试时拓展”,即模型在推理时多次迭代优化结果,还构建 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果