A:APRIL是华盛顿大学开发的一个包含26万个错误证明修复案例的数据集。每个案例都包括一个有错误的Lean数学证明、编译器错误信息、修正后的正确证明,以及用自然语言解释错误原因和修复方法的文本,专门用于训练AI学会从编译器反馈中修复证明错误。
硅谷科技圈迎来新一轮大模型较量,OpenAI与Anthropic同日发布重磅产品,引发全球开发者热议。两大编程领域顶尖模型正面交锋,权威评测机构Arena.ai与EpochAI的最新榜单为这场技术对决增添了戏剧性转折。
【新智元导读】硅谷的夜再次被点亮,OpenAI和Anthropic同日发布最新模型。正当开发者们沉浸在Codex 5.3的极致速度时,Arena和Epoch两大权威榜单却给出了意想不到的终局判决。
The Relentless Andrew Yang他热爱解决问题。但如果政治根本就不是为了“解决问题”呢?作者:Xochitl Gonzalez 摄影:John Locher/美联社(AP) 2026年2月5日还记得“杨帮”(Yang Gang)吗 ...
KUNMING/NEW YORK, Feb. 4 (Xinhua) -- What began as a lighthearted joke among friends has evolved into a global phenomenon: Chinese American creator Sherry Zhu has captivated audiences worldwide with h ...
教育局持续于中小学加大力度推动数字教育,去年初成立的数字教育策略发展督导委员会提出相关建议,其中一项重点便是为学校提供更多数字教育的学与教资源。由优质教育基金拨备5亿港元推行的“电子学习配套计划” (eLAFP计划)合共资助22个项目开发有助学校推动电子学习的配套设施,第一批三个项目成果推出之后广受欢迎,订阅的中、小学数目合共153间,部分学校订阅超过一个项目。
很少有人真正见过陈俊彦的工作空间。在纽约布鲁克林的一间安静房间里,窗帘拉着半开,桌上摊着写满人物心理、叙事弧线与节奏草图的手稿,墙上贴着不断更新的结构图,电脑荧幕停在时间轴的某个切点上,似乎已经被来回检查了数十遍。外界世界的流动在这里仿佛暂停,而空气中弥漫着一种专注与沉思混合的质感。对他来说,这个空间不仅是工作间,更像是他与影像进行深度对话的实验室。剪辑在他眼中不是技巧堆叠,而是一种重新组织情绪的 ...
这是一项由科赫大学(Koc University)伊斯坦布尔校区、加州伯克利大学等机构的研究团队合作完成的研究,论文发表于2026年1月,论文编号为arXiv:2601.22801v1,有兴趣深入了解的读者可以通过这个编号在学术数据库中查询完整论文。
人工智能在复杂推理任务中的表现长期受制于逻辑漏洞问题——即便最终答案正确,中间步骤也可能漏洞百出。香港科技大学、上海人工智能实验室、浙江大学及香港浸会大学联合团队提出突破性解决方案,通过引入形式化验证系统,让语言模型在推理过程中接受"实时逻辑检查",显著提升了推理严谨性。相关研究论文已发表于学术平台,其创新框架为AI推理能力升级开辟了新路径。
SpaceX 正式对外官宣,已完成对xAI的收购。披露信息显示,本次交易中,SpaceX 估值约为 1 万亿美元,xAI 估值约为 2500 亿美元,合并后估值为1.25万亿美金。
这项由中国人民大学高瓴人工智能学院与DP Technology公司合作完成的研究发表于2026年2月的arXiv预印本平台,编号为arXiv:2601.23184v1。该研究提出了一种名为ReGuLaR的创新方法,成功解决了大型语言模型在思维推理过程中既费时又费力的难题。有兴趣深入了解的读者可以通过论文编号arXiv:2601.23184v1查询完整论文。
研究团队发现,要让AI真正学会复杂推理,关键在于给它提供"过程级别"的指导。就像一个好的数学老师不仅会告诉学生最终答案对不对,还会逐步检查每一个推理步骤,指出哪里做得好,哪里需要改进。这种细致入微的指导方式能够让学习者更精确地理解问题的本质和解决方法。