B Math - 搜索 News

腾讯网

广州00后辍学生硅谷狂揽4.6亿！

狂揽4.6亿元！近日，来自广州的00后再一次刷新了硅谷的想象。总部位于旧金山的人工智能初创公司Axiom Math，宣布完成首轮6400万美元（约合4.6亿元人民币）融资。Axiom Math由B ...

24 分钟

DeepSeek V3.2发布！实测效果惊艳，便宜是最大优势

DeepSeek V3.2强吗？确实强，但是并没有断崖式领先，从测试结果来看与GPT-5 High及Gemini 3.0 Pro都是有来有回。但是，当一个能在多个权威基准里对标 GPT-5、Gemini 3.0 ...

腾讯网

图宾根大学团队破解AI数学推理边界：现有强化学习方法其实只是 ...

这就好比教一个学生解题：传统的强化学习方法更像是告诉学生"这个答案对，那个答案错"，但没有教会他新的解题思路；而长推理链蒸馏则像是让学生观看优秀教师的详细解题过程，从中学习新的思维方法。

7 天

图宾根大学揭示AI数学推理强化学习局限

为了验证这个假设并推动真正的进步，研究团队创建了一个名为MATH-Beyond（简称MATH-B）的全新数学基准测试。这个测试的设计理念很巧妙：它专门收集那些即使给现有开源模型1024次尝试机会，它们依然无法解决的数学问题。

头部财经

又强大又便宜！DeepSeek V3.2又让谷歌和OpenAI慌了

小雷发现，DeepSeek似乎真的很喜欢大晚上给大家突然来个惊喜。 12月1日晚，DeepSeek突然来了一波更新：V3.2版本正式上线并向所有用户开放，同时也在各个开源社区上传了V3.2的本地部署模型供所有用户使用。从官方公布的测试结果来看，DeepSeek V3.2的推理能力已经基本与OpenAI的GPT-5相近，但是其成本却远低于GPT-5，可以说仅这一点就足以让不少人为之兴奋了。好了，废 ...

4 天on MSN

国产开源新突破！DeepSeek-Math-V2数学编程双强，性能直逼GPT-4o

人工智能领域迎来新突破，DeepSeek团队在开源社区Hugging ...

4 天on MSN

DeepSeek携DeepSeek-Math-V2归来，开启自我验证数学推理新方向

人工智能领域迎来重大突破，DeepSeek团队近日在Hugging Face平台发布了全新数学推理模型DeepSeek-Math-V2。该模型在定理证明能力上实现质的飞跃，不仅超越了Gemini DeepThink等主流模型，更在国际数学奥林匹克竞赛（IMO）级别的测试中达到金牌标准。

4 天on MSN

DeepSeek新模型Math-V2达奥数金牌水平，或推动数学AI系统新发展

在人工智能领域，数学推理能力的突破一直是备受瞩目的焦点。近日，DeepSeek在Hugging ...

1 天on MSN

DeepSeek发布V3.2正式版及Speciale版：推理能力升级，探索模型能力边界

DeepSeek 官方近日宣布正式推出两款全新模型：DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale。此次发布标志着该公司在开源模型领域的技术突破，尤其在推理能力与工具调用方面实现了重要进展。 DeepSeek-V3.2 ...

7 天

祝贺！北大6位学者获千万级资助！

丁剑教授曾获多项重要学术荣誉，包括洛伊夫概率奖、科学探索奖、戴维逊奖和斯隆研究奖等；2025年入选美国数理统计学会会士。现任 Ann. Appl. Probab. 联席主编，并任 J. Amer. Math. Soc., Forum Math. Pi ...

1 天

DeepSeek的模型，让AI第一次学会了反思

另一个叫验证器（Verifier）。这哥们儿是个极其刻薄、吹毛求疵、毫无感情的老师。生成器写完的每一个字，都要经过它的审判。它就像拿着放大镜一样，逐行检查，寻找任何可能的逻辑漏洞、计算错误、概念不清。

1 天

出手就对标马斯克，中国00后正扎堆改变世界

这次小试牛刀，让付智关于算力共享平台的构想愈发成型。在他看来，广大中小企业与个人开发者对AI算力存在大量弹性需求，就像遍布大街的乘客。另一方面，中国拥有5.7亿台个人电脑，其中67%的算力处于日常闲置状态，就像空载的车辆。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果