B Math - 搜索 News

1 小时on MSN

DeepSeek的一次小更新：暴打OpenAI 追上Gemini

坏消息，开源模型和闭源模型的差距越来越大了。好消息，DeepSeek 又出手了。 12 月 1 日，DeepSeek 发布了两款新模型 —— DeepSeek V3.2 和 DeepSeek-V3.2-Speciale。前者和 GPT-5 能打的有来有回，后面的高性能版更是直接把 GPT 爆了，开始和闭源模型天花板 —— Gemini 打了个五五开。

少数派 on MSN

派早报：三星发布 Galaxy Z TriFold、索尼发布 Alpha 7 V 等

Apple Music、亚马逊音乐、YouTube 上线年度回顾，XREAL 宣布推出 AR 眼镜新品 XREAL 1S 等。

头部财经

AI最烧钱的战场：数据中心的真实账单

5000亿美元，是NASA预估能让人类完成火星登陆的预算、能买下1.36个阿里（3670亿美元）、3.5个NBA联盟（1400亿美元）、建设100座Apple Park（50亿美元）、买1400亿杯咖啡（3.5美元），却只够OpenAI建一座Stargate数据中心。但这，也许只是开始，业内人士认为，OpenAI的野心甚至是这个数据的十倍。xAI、meta等科技巨头，都开始疯狂在AI数据中心砸钱 ...

21经济网

孙正义回应清仓英伟达；“豆包手机”来了丨新鲜早科技

12月1日消息，软银集团创始人孙正义坦言，如果软银在推进AI计划时能有“无限的资金”，那么自己根本不会卖掉英伟达的股票，只是因为为了大力投资OpenAI等一系列项目，才不得不割爱。这是孙正义对软银清仓英伟达全部持股的首次回应。他在东京的FII Priority ...

腾讯网

美国大学生数学差到离谱，世界名校的新生连四舍五入都不会

小学生就应该掌握的数学技能——分数加法和四舍五入，对于加州大学圣地亚哥分校（简称UCSD，一所被《美国新闻与世界报道》评为全美第六的顶尖公立大学）的很多新生来说，却是难题，他们很多连这都不会。

1 天on MSN

DeepSeek发布V3.2正式版及Speciale版：推理能力升级，探索模型能力边界

DeepSeek 官方近日宣布正式推出两款全新模型：DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale。此次发布标志着该公司在开源模型领域的技术突破，尤其在推理能力与工具调用方面实现了重要进展。 DeepSeek-V3.2 ...

1 天on MSN

DeepSeek V3.2系列正式版发布！推理能力追平GPT-5、奥林匹克金牌拿到手软

快科技12月1日消息，今日，DeepSeek发布两个正式版模型，分别为DeepSeek-V3.2和DeepSeek-V3.2-Speciale，前者主打日常使用，后者在多项国际竞赛中获得金牌。

1 天

DeepSeek的模型，让AI第一次学会了反思

另一个叫验证器（Verifier）。这哥们儿是个极其刻薄、吹毛求疵、毫无感情的老师。生成器写完的每一个字，都要经过它的审判。它就像拿着放大镜一样，逐行检查，寻找任何可能的逻辑漏洞、计算错误、概念不清。

2 天

豆包手机助手发布技术预览版，阿里上调AI投入指引！阿里巴巴、中 ...

消息面上，白宫有关人士表示，有迹象显示美高层可能在年底前敲定下任美联储主席人选，市场对此反应积极。此外，高盛表示，美联储将在12月9-10日议息会议上下调利率，几乎已无悬念。当前市场对25个基点降息的定价概率已达到约 85%—86% 。

爱范儿

早报｜多家企业紧急捐赠逾亿元驰援香港火灾/国产厂商集体叫停Air ...

11 月 26 日下午，香港新界大埔小区宏福苑发生重大火灾，造成严重人员伤亡。据香港消防处公布的数据，截至今日零时，已有 83 人遇难，1 名消防员牺牲，76 人受伤，警方拘捕 3 名涉嫌误杀的男子。

腾讯网

图宾根大学团队破解AI数学推理边界：现有强化学习方法其实只是 ...

这就好比教一个学生解题：传统的强化学习方法更像是告诉学生"这个答案对，那个答案错"，但没有教会他新的解题思路；而长推理链蒸馏则像是让学生观看优秀教师的详细解题过程，从中学习新的思维方法。

7 天

图宾根大学揭示AI数学推理强化学习局限

为了验证这个假设并推动真正的进步，研究团队创建了一个名为MATH-Beyond（简称MATH-B）的全新数学基准测试。这个测试的设计理念很巧妙：它专门收集那些即使给现有开源模型1024次尝试机会，它们依然无法解决的数学问题。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果