布鲁姆也提出了类似的疑问。他表示不会感到惊讶如果这个已解决的问题实际上曾出现在某个数学竞赛中,这样它可能已经是训练数据的一部分。在数学竞赛中,参赛者通常被告知一个简短优雅的解法是存在的——这正是 Aristotle 面对的情况。
数学 AI 智能体 Aristotle 是一个一个用于自动形式化和形式验证的 API。根据 Harmonic 的介绍,其具备利用 IMO 金牌级引擎解决最复杂的推理问题的能力;可以自动将英语陈述和证明转换为经过验证的 Lean4 ...
不到 24 小时后,埃尔德什问题网站的维护者托马斯·布鲁姆(Thomas Bloom)也发表了一系列评论。“这是一个很好的证明,完全由人工智能从形式化陈述出发、无人工干预生成,然后在 Lean 中形式化,这本身已经令人印象深刻,”布鲁姆写道,“事后来看,解决方案相当简单,使得这个问题处于数学竞赛题的水平。埃尔德什提出这个问题时有两个不同的版本。人工智能解决的是更简单的那个。” ...
【新智元导读】昨晚,数学界炸了!AI数学家「亚里士多德」竟在6个小时内,一键破解了30年难题的简版,引陶哲轩盛赞。数学领域Vibe proving时代来了。 它在Lean证明系统中,耗时仅6个小时,验证只需1分钟。
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!DeepSeek发布的DeepSeek-Math-V2,在IMO 2025(2025国际奥数)和CMO 2024(2024中国奥数)上获得了金牌级分数,在Putnam ...