资讯
14 小时
科技行者 on MSNNewsBreak团队推出DuaShepherd:让AI数学推理更聪明的双重奖励系统这项由NewsBreak公司的吴远豪、宋俊彤、牛承等研究人员与伊利诺伊大学厄巴纳-香槟分校的张汉宁、张彤团队共同完成的研究发表于2025年6月,论文标题为"DuaShepherd: Integrating Stepwise Correctness and Potential Rewards for Mathematical ...
当大模型面对数学题反复“纠结”时,这种反思行为究竟是有效探索还是无效模式?针对这一核心问题,美国西北大学与谷歌、谷歌 DeepMind 团队在最新合作研究中给出了系统性解答。他们提出了贝叶斯自适应强化学习(BARL,Bayes-Adaptive ...
最新报道称,R2很可能不会在短期内发布,原因在于梁文锋对R2现在的性能还不满意,工程师团队仍在全力优化和打磨,部分原因受到算力影响。这意味着R2仍在谋求远超前代的性能,届时“四小虎”如果停滞不前,压力无疑会更大。
7 天
少数派 on MSN派早报:QQ 超级会员话费会员业务终止,联发科发布天玑 8450 芯片等三星发布 Exynos 2500 处理器,网易有道开源「子曰 3」数学模型等。
According to the US media, Hong Letong, a Stanford math PhD graduate born in the 00s, has recently founded an AI startup ...
8 天on MSN
网易有道近期宣布了一项重大举措,正式将“子曰3”系列大模型中的数学模型(英文名Confucius3-Math)向公众开源。这款模型是国内首个专注于数学教育领域的开源推理模型,其独特之处在于能够在单块消费级GPU上高效运行,无需高昂的硬件投入。
点击上方蓝字,关注「Python图书馆」你是否也有过这样的经历?花了一个周末写出一个完美的数据分析脚本,算法逻辑清晰,代码优雅易读,结果一跑起来...去泡杯茶回来还在那儿转圈圈。特别是处理大型数据集或者复杂科学计算时,Python的执行速度简直让人抓 ...
然而,为了保护核心知识产权(如防止模型蒸馏或 Agent 工作流泄露)、提供更流畅的用户体验,服务提供商通常会将这些中间步骤隐藏,仅向用户呈现最终的输出结果。这在当前的商业和技术环境下,是一种保护创新、简化交互的常见做法。 近期,CASE Lab ...
红板报 on MSN14 天
大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背 ...MathFusion团队 投稿量子位 | 公众号 QbitAI 当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换,好比是让学生反复做同一道题的变种,却忽略了数学题目之间内在的关联性。 为了打破这种局限,让大模型学会“串联”与“并联”知识,上海AI Lab、人大高瓴等团队联合提出了MathFusion,通过指令融合增强大语言模型解决数学问题的能力。 仅使用45K的合成指令,MathFus ...
Thinkless 框架的提出,正是为了打破这一困局。它可以赋予 LLM 一种“情境感知”的能力,使其能够像经验丰富的工匠一样,根据手头任务的复杂度和自身技艺的精湛程度,灵活地选择最合适的工具。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果