智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。 在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude ...
著名独立评测机构Artificial Analysis最新模型排名来了,Kimi K2.5总体排名第五,GPT5.2high=51,Claude opus 4.5=50,GPT5.2codexhigh=49,Gemini3 prohigh=48,Kimi k2.5=47 要点总结: 在智能体任务上表现出色: Kimi K2.5 在GDPval-AA 评估中取得了 1309 的 Elo 评分,仅次于 ...
想象一下,如果两个世界上最聪明的大脑宣布自己又加了一层智力提升 200 的 buff 。。。。。。 这就是2026年2月6日发生的事。 这一天,人工智能领域的两大巨头Anthropic和OpenAI,各自亮出了最新王牌:Claude Opus 4. 6和GPT-5.3-Codex。 这不是简单的版本更新,更像是一场 ...
An illustration Anthropic commissioned to mark the release of Opus 4.5. (Anthropic) Hot on the heels of Google's Gemini 3 Pro release, Anthropic has announced an update for its flagship Opus model.