北京时间 2 月 6 日凌晨,Anthropic 与 OpenAI 相继推出了新版本基础大模型,分别是 Claude Opus 4.6 与 GPT-5.3-Codex。 Claude Opus 4.6 是 Anthropic ...
最重要的是,在GDPval-AA知识工作的性能评估中,Opus 4.6比GPT-5.2高出约144 Elo分,比上一代 Opus 4.5高出190分。 这种能力延伸到了长上下文任务中,它可以在数十万Token中保存和跟踪信息,且漂移更少,并且能捕捉到即使是Opus 4.5也会错过的深埋细节。
在发布前的测试中,Anthropic的前沿红队把Opus 4.6扔进一个沙箱环境,给它 Python 和常规漏洞分析工具(fuzzer、debugger那些),没有任何专门指令或领域知识,让它自己去找开源代码里的漏洞。
IT之家 2 月 6 日消息,Anthropic 昨日(2 月 5 日)发布新一代 AI 模型 Claude Opus 4.6,重点突破自主性与专注度, 不仅显著提升了代码规划、调试及审查能力,还首次在测试版中引入了 100 万 token 的超大上下文窗口。
Anthropic的Claude Code正在掀起一场AI应用热潮,其影响力被业内人士比作生成式AI的首次问世。这款AI编程工具让非技术人员也能轻松构建软件,正在重塑人们对人工智能能力边界的认知。据华尔街日报周六报道,Claude Code的最新版本Claude Opus 4.5展现出惊人能力,网站开发平台Vercel的首席技术官Malte ...
Claude Code的最新版本Claude Opus 4.5展现出惊人能力,网站开发平台Vercel的首席技术官Malte Ubl表示,他用这款工具 在一周内完成了原本需要一年才能完成的复杂项目 ,许多用户在社交媒体上分享了自己从未学过编程却成功开发出首个软件的经历。
大家好,我是袋鼠帝。 AI圈卷已经说累了,最近不是在跑Case,就是在找Case的路上... 昨晚被智谱的GLM-4.5刷屏了,很多人都在讨论。 GLM-4.5是他们的新一代旗舰模型而且,它又又又是开源的! 智谱还发了50块包月爽玩券(领取方式放最后了),所以,我忍不住第一 ...
SemiAnalysis分析指出,Claude ...
华尔街见闻 on MSN
“AI编程”里程碑:Claude Code“整顿”全球软件业
Claude Code随着最新模型Claude Opus 4.5上线迎来爆发,多位开发者称,AI编程能力出现阶跃式提升,从辅助补全迈向真正的代理式开发。该产品发布不足一年ARR已达10亿美元,成为Anthropic增长最快的业务之一,并深度改变公司内部的工程协作方式,同时向更广泛的知识工作领域扩展。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果