资讯

现在,上海交大联合深势科技团队突然发布了一项新研究,在“人类最后的考试”(HLE,Humanity’s Last Exam)上一举拿下32.1分,创下新纪录。
【新智元导读】 最近,Ai2耶鲁NYU联合推出了一个科研版「Chatbot Arena」——SciArena。全球23款顶尖大模型火拼真实科研任务,OpenAI ...
鉴于这些进展,OpenAI内部分析师认为,智谱推出的“中国版OpenAI本土化产品”在欧美市场深入前取得了显著进展。知名财经媒体CNBC引用了OpenAI的博文,明确指出智谱让OpenAI感受到了来自中国的挑战。CNBC评论称,这表明智谱对OpenA ...
随着以DeepSeek代表的开源大模型和以Manus为代表的Agent的爆火,开源大模型和智能体成为了AI领域大众关注的新焦点,而曾经风光无限的AI六小虎热度则不断下滑,甚至有部分人群认为中国的AI六小虎纷纷陷入了发展瓶颈。
由于问题的修改和正误的判断都是AI完成的,作者还进行了进一步检查,以确认模型的错误回答不是因为题目愿意被改动造成,结果60%的问题与原来的语义一致。 DeepSeek R1的错误率翻3倍,从随机错误率的1.5%增加到4.5%。
在AI大模型领域,成本一直是制约技术普及的关键因素。OpenAI的GPT系列虽然性能强大,但高昂的API调用费用让许多中小企业和开发者望而却步。然而,中国AI企业DeepSeek却以惊人的成本优势杀出重围——其大模型API调用成本仅为OpenAI的1/20!这一突破不仅让全球AI行业侧目,更让中国AI在技术自主化的道路上迈出了坚实一步。
快科技6月30日消息,近日,OpenAI旗下OpenAI Global Affairs账号在发布了《Chinese Progress at the Front》(中国在前沿领域进展)的文章。
格隆汇7月4日|零一万物CEO、创新工场董事长李开复博士在今日举行的格隆汇中期策略峰会上称:尽管美国在科研领域处于领先地位,但中国展现出强大的学习能力、卓越的工程能力,加之中国创业者具有的拼搏精神,因此在未来的竞争中,谁将胜出尚难以定论。目前,无论是 ...
除了市场竞争的压力,OpenAI还面临着企业战略转型的挑战。 Altman曾公开承认,OpenAI在开源方面曾站在“历史错误的一边”。 此次开源模型被视为修复开发者关系的关键举措,若无法在性能上匹敌DeepSeek R1等头部开源产品,将对OpenAI的声誉造成重大影响。
当开源AI模型正成为技术巨头必争之地,OpenAI却出人意料地按下暂停键。OpenAI首席执行官Sam Altman宣布其备受期待的开源模型将延期至“今年夏天晚些 ...