智东西2月6日报道,今天,就在Claude发布Opus 4.6后的几分钟,OpenAI也推出了自家的最新编程模型:GPT-5.3-Codex。OpenAI号称,这是世界上最强大的智能体(Agentic)编程模型。 GPT-5.3-Codex在SWE-Bench Pro和Terminal-Bench 2.0这两个编程基准测试中拿到了SOTA,并在OSWorld和GDPval等 ...
在春节来临之前,海外大模型先来了一波硬碰硬的发布。 北京时间 2 月 6 日凌晨,Anthropic 与 OpenAI 相继推出了新版本基础大模型,分别是 Claude Opus 4.6 与 GPT-5.3-Codex。 昨天两家还在因为 AI 里面的广告而论战,今天在大模型发布上又撞车了。话不多说,直接看他们 ...
On Tuesday, Anthropic’s Claude 3 Opus large language model (LLM) surpassed OpenAI’s GPT-4 (which powers ChatGPT) for the first time on Chatbot Arena, a popular crowdsourced leaderboard used by AI ...
IT之家 2 月 6 日消息,OpenAI 昨日(2 月 5 日)发布公告,宣布推出 GPT-5.3-Codex,宣称这是其迄今最强的 AI 智能体编程模型。 IT之家附上相关基准测试结果如下: 在 SWE-bench Pro(公开版)测试中,该模型得分 56.8%,超越了前代的 56.4%; 在 Terminal-Bench 2.0 测试中,其 ...
OpenAI 近日正式发布 GPT-5.3-Codex,这是其迄今为止最先进的代码专用 AI 代理模型。OpenAI 表示,该模型在性能与响应速度上均较上一代 GPT-5.2-Codex 实现显著提升,面向专业软件开发和工程级工作流设计。 在性能方面,GPT-5.3-Codex 在多项权威基准测试中取得新纪录。