AI圈迎来了新年的第一个双响炮啊, Anthropic刚发了Claude Opus 4.6,OpenAI也发了GPT‑5.3-Codex,在Codex ...
在知识工作能力的评测GDPval-AA 上,Opus 4.6比OpenAI的GPT-5.2高出约144Elo分,比自己的前代Opus 4.5高出190分。这个测试涵盖了金融、法律等领域的实际工作任务,比如制作财务分析报告、起草法律文件、做市场调研等。