Opus 2 - 搜索 News

10 天

GPT-5.2 vs Claude Opus 4.5：长程自动化编程任务的王者之争

这种能力的差异，反映了两者在理解复杂指令和保持长时间专注上的不同。GPT-5.2能够更精准地遵循复杂的指令，确保在漫长的编程过程中不偏离目标，成功避免了长程任务中常见的“目标漂移”问题。这不仅仅是技术的胜利，更是对未来编程模式的一次重要探索。

腾讯网

新研究显示GPT-5.2可规模化开发0Day漏洞利用程序

一项突破性实验表明，先进语言模型现已能够为未知安全漏洞创建有效的利用程序。安全研究员 Sean Heelen 近期测试了基于 GPT-5.2 和 Opus 4.5 构建的两套复杂系统，要求它们针对 QuickJS JavaScript 解释器中的 ...

12 天

从“生成”到“深度推理”：2026 大模型三巨头横评：Gemini 3 Pro、GPT-5 ...

根据 Google DeepMind 最新的技术报告，Gemini 3 Pro 在处理需要多步逻辑跳转的 GPQA (Graduate-Level Google-Proof Q&A) 测试中，准确率首次突破了 80% ...

10 天

Cursor 实测：在长程自动化编程任务中，GPT-5.2 表现优于 Claude Opus 4.5

知名 AI 编程辅助工具 Cursor 近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时，OpenAI 最新的 GPT-5.2 模型表现出比 Anthropic 的 Claude Opus4.5 更高的可靠性。为了验证模型能力，Cursor 团队尝试从零开始构建一个功能完备的 Web 浏览器，涵盖了 HTML 解析、CSS 布局及自定义 JavaScript 虚拟机等复杂底层架构。

腾讯网

刚刚，智能体&编程新王Claude Opus 4.5震撼登场，定价大降2/3

如昨日预期一样，Anthropic 正式发布了最新模型 Claude Opus 4.5。根据介绍，Claude Opus 4.5 非常智能高效，在编程、智能体以及计算机操作方面表现卓越，是当今世界最优秀的模型。该模型在深度研究、处理幻灯片与电子表格等日常任务上也有显著提升。该模型标志 ...

新浪网

Claude Opus 4.5发布！2小时工程测试超人类，前代Sonnet搞不定的活它轻松 ...

两小时高强度工程任务，模型得分超过所有人类！刚刚，Claude Opus 4.5问世，主打编码、Agent与computer use。 Opus 4.5在前端开发、视觉能力上显著提升，更擅长使用电脑。在深度研究、PPT制作与电子表格处理等日常任务方面的表现也全面升级。让它用附件模板创建 ...

新浪网

Anthropic最新Claude Opus 4.5大模型上市，API价格大降2/3

【TechWeb】11月25日消息，Anthropic最新的大模型Claude Opus 4.5今天上市。Anthropic团队表示，Claude Opus 4.5智能、高效，是世界上最好的编码、Agent和计算机使用模型。它在深度研究、使用PPT和Excel等日常任务中也表现得更好。 Anthropic认为，Claude Opus 4.5是现实世界软件工程 ...

知乎 on MSN

ChatGPT5.2和Gemini3到底谁更强?

我做AI 4 Science，实现路径是Agent，我自己搭建框架后使用OpenRouter的体感是GPT5.2 Pro >= Opus 4.5 >= GPT5.2 Codex = GPT5.2 > Gemini 2.5 Pro >> Gemini 3.0 Pro。 GPT5.2 Pro在Thinking ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果