大型语言模型(LLMs)虽然通过可验证奖励的强化学习(RLVR)取得了显著进展,但仍然在很大程度上依赖外部监督(例如人工标注的数据)。自博弈(self-play)提供了一种有前景的替代方案,使模型能够通过与自身反复对抗来学习,从而减少对外部监督的依赖 ...
如今31岁的朱雯琪即将完成在牛津大学数学系的博士学业,她给自己解锁了新任务——回国创业。11月,朱雯琪选择将公司落地深圳南山,成为一名初创CEO,“希望用AI技术把母亲独特教育方法和在牛津10年的学习功力全部复制出来,连接到每个孩子的书桌,让每个人都 ...
HANGZHOU, Nov. 28 (Xinhua) -- Chinese AI firm DeepSeek has launched DeepSeekMath-V2, a groundbreaking mathematical reasoning model that sets new performance benchmarks and pushes the frontiers of ...
12月5日,美国数学学会(American Mathematical Society,AMS)在其官网公布了2026年Chevalley Prize in Lie Theory(谢瓦莱李理论奖)的获得者。本次该奖授予了来自德国波恩大学的Tasho ...
这个出了名难到变态的“威廉·洛厄尔·普特南数学竞赛”(William Lowell Putnam Mathematical Competition),与其说是一场学术测验,不如说更像一场数学体育赛事。这场年度考试吸引了成千上万的学生,但其中大部分人总分不太可能超过3分(满分120分)。
芝加哥大学的弗兰克·卡莱加里 (Frank Calegari)、加州理工学院的韦塞林·迪米特洛夫 (Vesselin Dimitrov) 和加州大学伯克利分校的唐云清 ( Yunqing Tang ) 因其在《美国数学会杂志》 Journal of ...
南开新闻网讯 (通讯员 刘旭阳 记者 刘喆萱)近日,南开大学陈省身数学研究所讲席教授Joshua Zahl与合作者的论文“Sticky Kakeya sets and the sticky Kakeya ...
近日,AI 初创公司 Axiom 宣布其模型在没有人类干预的情况下,自动完成了两个数学猜想的证明——埃尔德什问题(Erdős Problem)中的 481 号和 124 号。据称,481 号问题仅用时 5 小时,代码量为 656 行;124 ...
新闻中, Y库这件“破案利器”总是与陈年积案、重大命案的侦破联系在一起。 它能够在常规手段一无所获时起到奇效,即便嫌疑人信息不在数据库内,警方依然可以借助它定位目标。
南开大学校长陈雨露,南开大学终身校董、南开校友企业家联谊会主席、物美集团创始人张文中,中国科学院院士、陈省身数学研究所教授龙以明,中国科学院院士、陈省身数学研究所教授张伟平出席活动。副校长白承铭主持颁奖仪式。
Competition among leading global tech companies in the AI model arena is intensifying. In August, OpenAI launched its ...