我们在网上也找了一些 Opus 4.6 最新的测试案例,有网友说 Claude 4.6 Opus 只是一次调用,就完全重构了他的整个代码库,将原来混乱的代码「屎山」全部模块化,并且没有模型能像 Opus 这样做到。
今天凌晨发布的 GPT-5.3-Codex 可以说是 OpenAI 对这段时间来,各种本地 Agent 爆火的一记重拳回击,当然主要是对 Anthropic 的反击。配合 OpenAI 前几天的发布的 Codex 桌面版应用,Skill、Cowork ...
北京时间 2 月 6 日凌晨,Anthropic 与 OpenAI 相继推出了新版本基础大模型,分别是 Claude Opus 4.6 与 GPT-5.3-Codex。 Claude Opus 4.6 是 Anthropic ...
OSWorld-Verified于2025年7月28日发布,是一次全面重构,修复了原版中300+已识别问题,包括失效 URL、反爬 CAPTCHA、不稳定 HTML 结构、含糊指令,以及过严/过松的评测脚本。
周四,Anthropic和OpenAI同时发布了基于相同理念的产品:用户不再与单个AI助手聊天,而是管理分工协作、并行运行的AI智能体团队。这标志着行业正从AI对话伙伴向AI委派工作力转变。Anthropic推出Claude Opus ...
就在昨天,Sam Altman 刚在 X 平台上凡尔赛了一把 Codex 的「百万活跃用户」里程碑。短短一天后,OpenAI 再次乘胜追击,扔出王炸——GPT-5.3-Codex。 说人话就是:AI 已经学会了自己写代码、自己找 Bug,甚至开始自己训练下一代的 AI 了。这种自我进化能力,也直接体现在了一连串跑分数据上。
为了展示 Opus 4.6 的极限,Anthropic 的研究员 Nicholas Carlini 搞了个疯狂的实验:充值了 2 万美元的 API 额度,让 16 个 Claude Opus 4.6 组成一个「全自动软件开发团队」。
2026年的这一天注定会被写入AI发展史。 Claude Opus 4.6和GPT-5.3 Codex在相隔不到一个小时的时间里先后发布。 两家公司似乎都憋着一口气,要在同一个时间节点上交出自己的答卷。
【本文由小黑盒作者@飞碟AI于02月06日发布,转载请标明出处!】 凌晨,Anthropic 丢出重磅更新,跟本公众号昨天发布的爆料不一样,本以为是发布的Claude 5.0,但是这次版本号是4.6,还没来得及欢呼,紧接着OpenAI ...
指数栏的上证指数之报价为实时更新,数据更新时间为 19/01/2026 16:30 指数栏的期指之报价为实时更新,数据更新时间为 20/01/2026 02:50 行业升跌比例,购沽比例及牛熊比例均以成交金额计算,更新时间延迟最少15分钟 没有显示实时卷标的报价数据均延迟最少15分钟 ...
近期推出的 PS5 独占作品Code Violet自发布以来,市场反响较为低迷,专业评测机构给出了4分的评价,认为其表现未能达到主流第三人称射击游戏的基本水准。这一评分也引发了玩家社区的广泛讨论。
Anthropic 已上调未来几年的营收预测,预计今年销售额将增长四倍,达到 180 亿美元,明年将达到 550 亿美元,目标是缩小与老对手 OpenAI 的营收差距。 新的预测反映了 Anthropic 近期的成功,包括其编码助手 Claude Code 的增长 —— 该产品在 11 月创造了超过 10 亿美元的年化收入,约占当时总年化收入的 14%,助力公司在去年年底实现了超过 90 ...