资讯

入选的问题涵盖了数理化、生物医药、工程和社会科学等多种学科,按细分学科来算则多达100余个。按大类来分,可分为八大类,其中占比最多的是数学(42%),然后是物理和生物医药(均为11%)。
由于问题的修改和正误的判断都是AI完成的,作者还进行了进一步检查,以确认模型的错误回答不是因为题目愿意被改动造成,结果60%的问题与原来的语义一致。 DeepSeek R1的错误率翻3倍,从随机错误率的1.5%增加到4.5%。
谁会第一个到达ASI?SemiAnalysis大佬Dylan Patel脱口而出:OpenAI!最近,这位圈内最懂AI和芯片的大佬,毫不留情地戳穿了GPT-4.5惨败的原因,还揭露了Meta仓促模仿DeepSeek结果大翻车的内幕。
(华盛顿8日讯)美国人工智能(AI)新创公司OpenAI声称遭中国竞争对手锁定后,近几个月彻底改革安全行动,以防知识产权遭企业间谍活动侵害,包括增加指纹扫描措施,并聘请军事专家保护重要资料。台湾中央社引述英国《金融时报》报导,知情人士表示,OpenA ...
通过坚持技术创新、用户至上和开放合作的发展理念,DeepSeek在全球AI竞争中已占据了有利位置。公司的国际化战略不仅为自身带来了更广阔的发展空间,也为中国科技企业参与全球竞争提供了有益借鉴,展现了中国企业在全球科技舞台上的新形象。
在 AI 模型进入全品类竞争、全链路比拼的“决胜年”,DeepSeek 的路线越来越显得“离经叛道”:它不是追求用户留存的商业公司,也不是一味求快的工程团队,而更像一个为未来下注的算力实验室。当所有人都在卷产品体验、卷多模态场景,DeepSeek ...
本来预计今年5月就会更新换代的DeepSeek-R2,时间一拖再拖让人浮想联翩。现在很多人甚至淡忘了DeepSeek问世时的辉煌。其使用率从年初的50%,暴跌至目前的3%。
随着以DeepSeek代表的开源大模型和以Manus为代表的Agent的爆火,开源大模型和智能体成为了AI领域大众关注的新焦点,而曾经风光无限的AI六小虎热度则不断下滑,甚至有部分人群认为中国的AI六小虎纷纷陷入了发展瓶颈。
鉴于这些进展,OpenAI内部分析师认为,智谱推出的“中国版OpenAI本土化产品”在欧美市场深入前取得了显著进展。知名财经媒体CNBC引用了OpenAI的博文,明确指出智谱让OpenAI感受到了来自中国的挑战。CNBC评论称,这表明智谱对OpenA ...
快科技6月30日消息,近日,OpenAI旗下OpenAI Global Affairs账号在发布了《Chinese Progress at the Front》(中国在前沿领域进展)的文章。
The beefed-up security includes "information tenting" policies that limit staff access to sensitive algorithms and new ...