2026年2月5日,AI行业发生了一件载入史册的事。OpenAI和Anthropic在相隔不到20分钟的时间内,分别发布了GPT-5.3-Codex和Claude Opus 4.6——两个代表完全不同进化方向的顶级模型。一个学会了"自我繁殖": ...
OSWorld-Verified于2025年7月28日发布,是一次全面重构,修复了原版中300+已识别问题,包括失效 URL、反爬 CAPTCHA、不稳定 HTML 结构、含糊指令,以及过严/过松的评测脚本。
2025年10月,一家位于波士顿的医疗科技公司遭遇一场“教科书式”的网络攻击。攻击者并未暴力破解密码,也没有利用零日漏洞,而是通过一封看似普通的会议邀请邮件,附带一个名为“Q3_Investor_Briefing.html”的附件。财务总监Sarah点击后,浏览器跳转至一个与Microsoft 365登录页几乎无法区分的页面。她输入账号密码,随后手机收到一条来自微软的验证码短信——她照常输入。 几 ...