Opus 2 - 搜索 News

21 天

从“生成”到“深度推理”：2026 大模型三巨头横评：Gemini 3 Pro、GPT-5 ...

根据 Google DeepMind 最新的技术报告，Gemini 3 Pro 在处理需要多步逻辑跳转的 GPQA (Graduate-Level Google-Proof Q&A) 测试中，准确率首次突破了 80% 的大关，证明了其在深度认知任务上的绝对统治力。

新浪网

刚刚，智能体&编程新王Claude Opus 4.5震撼登场，定价大降2/3

如昨日预期一样，Anthropic 正式发布了最新模型 Claude Opus 4.5。根据介绍，Claude Opus 4.5 非常智能高效，在编程、智能体以及计算机操作方面表现卓越，是当今世界最优秀的模型。该模型在深度研究、处理幻灯片与电子表格等日常任务上也有显著提升。该模型标志 ...

19 天

Cursor 实测：在长程自动化编程任务中，GPT-5.2 表现优于 Claude Opus 4.5

知名 AI 编程辅助工具 Cursor 近日分享了一项内部测试发现:在处理超长程、自主性的编程任务时，OpenAI 最新的 GPT-5.2 模型表现出比 Anthropic 的 Claude Opus4.5 更高的可靠性。为了验证模型能力，Cursor 团队尝试从零开始构建一个功能完备的 Web 浏览器，涵盖了 HTML 解析、CSS 布局及自定义 JavaScript 虚拟机等复杂底层架构。

腾讯网

Anthropic最新Claude Opus 4.5大模型上市，API价格大降2/3

【TechWeb】11月25日消息，Anthropic最新的大模型Claude Opus 4.5今天上市。Anthropic团队表示，Claude Opus 4.5智能、高效，是世界上最好的编码、Agent和计算机使用模型。它在深度研究、使用PPT和Excel等日常任务中也表现得更好。 Anthropic认为，Claude Opus 4.5是现实世界软件工程 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果