B Math - 搜索 News

资讯

科技行者 on MSN14 小时

NewsBreak团队推出DuaShepherd：让AI数学推理更聪明的双重奖励系统

这项由NewsBreak公司的吴远豪、宋俊彤、牛承等研究人员与伊利诺伊大学厄巴纳-香槟分校的张汉宁、张彤团队共同完成的研究发表于2025年6月，论文标题为"DuaShepherd: Integrating Stepwise Correctness and Potential Rewards for Mathematical ...

至顶头条 on MSN18 小时

AI模型的"幸运数字"：为何都偏爱27？

当被要求猜测1到50之间的数字时，ChatGPT、Claude、Gemini和Llama等主流AI模型都给出了相同答案：27。研究显示，这种现象源于训练数据偏差和共同的词汇预测方法。专家指出，大语言模型缺乏真正的随机性，在数字选择上表现出高度确定性和 ...

腾讯网3 天

大模型反思是有效探索还是“形式主义”？科学家开发贝叶斯自适应 ...

当大模型面对数学题反复“纠结”时，这种反思行为究竟是有效探索还是无效模式？针对这一核心问题，美国西北大学与谷歌、谷歌 DeepMind 团队在最新合作研究中给出了系统性解答。他们提出了贝叶斯自适应强化学习（BARL，Bayes-Adaptive ...

4 天

DeepSeek-R2发布前，热锅上的“四小虎”

最新报道称，R2很可能不会在短期内发布，原因在于梁文锋对R2现在的性能还不满意，工程师团队仍在全力优化和打磨，部分原因受到算力影响。这意味着R2仍在谋求远超前代的性能，届时“四小虎”如果停滞不前，压力无疑会更大。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果