搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 7 天
时间不限
过去 1 小时
过去 24 小时
过去 30 天
按相关度排序
按时间排序
来自MSN
1 小时
国产AI大模型崛起,Kimi与DeepSeek能否成为新的OpenAI?
还记得当年GPT-3 吗? OpenAI笃信不管三七二十一,就是要把计算量堆上去试试,所以才有GPT-3,才有后续的一系列进展。如果当初OpenAI看到随着计算量增加模型的表现没有快速增长,就停止了缩放试验,现在也不用在这讨论这个问题了。
腾讯网
11 小时
李飞飞团队“50美元”复刻DeepSeek,一文读透背后逻辑
每经记者:宋欣悦 ...
19 小时
如何优化测试时计算?解决「元强化学习」问题
在元强化学习中,对于每个测试 MDP M_x,策略 A_θ 在通过 A_θ 生成最终响应进行评估之前,可以通过消耗测试时计算来获取信息。在元强化学习术语中,获得的关于测试 MDP M_x 的信息可以被视为在测试问题 x 引发的 MDP ...
2 天
图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和Inference Scaling ...
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:liyazhou ...
腾讯网
3 天
李飞飞团队50美元复刻DeepSeek-R1?一文读透背后的真正逻辑
每经记者:宋欣悦 每经编辑:兰素英2月6日,据外媒报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的费用,使用了16张英伟达H100 ...
3 天
李飞飞团队“50美元”复刻DeepSeek-R1?一文读透“白菜价”背后的真正 ...
2月6日,据外媒报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的费用,使用了16张英伟达H100 GPU,耗时26分钟就完成了训练,成功“打造”出了一个名为s1-32B的人工智能推理模型。
3 天
成本不到150元!26分钟训出个推理模型 媲美o1和R1
据TechCrunch,这个训练过程消耗了不到50美元的云计算成本,约合人民币364.61元;而s1模型作者之一表示, 训练s1所需的计算资源,在当下约花20美元 (约145.844元) 就能租到 。
2 天
李飞飞团队50美元训练出媲美DeepSeek的AI推理模型?真相来了
2025 年 2 月,斯坦福大学和华盛顿大学的研究人员宣布,他们成功训练出了一个名为 s1 的人工智能推理模型。据报道,该模型的训练成本极低,仅需不到 50 美元的云计算费用,且仅用了 16 个英伟达 H100 GPU 进行了 26 ...
来自MSN
2 天
不断有人在问,这个中国模型到底有什么魔力?
作者|Yoky邮箱|yokyliu@pingwest.com DeepSeek、李飞飞、LIMO,全球的AI界近期几乎都被这几个名词环绕,而这一切的背后,都要从一个“大隐隐于市”的高手谈起。
大公網
3 天
DeepSeek下载火爆 一周超过谷歌Gemini两年
近期,国产AI大模型DeepSeek横空出世,仅以几十分之一的成本,就达到与全球领先的ChatGPT最新o1版本推理模型相当的实力。目前,DeepSeek下载量持续攀升,据研究公司SimilarWeb估计,在短短一周内,DeepSeek网站的用户数量就超过了谷歌的Gemini聊天AI,而后者已经存在了近两年。一时间,各界众说纷纭:DeepSeek为什么这么牛?何以如此?是创新还是蒸馏?……诸如此类 ...
来自MSN
3 天
报道称李飞飞团队用不到 50 美元训练出媲美DeepSeek R1的 AI 推理模型 ...
媒体/自媒体的宣传出现了「一丢丢偏差」,我先结合论文简要说几点最关键的看法帮大家省流,然后还原一下这篇 AI 论文是如何在信息传递的过程中逐渐「被标题党」的。大家可以按需阅读。 下面的讨论主要基于最广为流传且被很多官媒转发的信息: ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈