IT之家 8 月 6 日消息,OpenAI 宣布推出两款开源模型 GPT-oss-120b 和 GPT-oss-20b,这是自 2020 年发布 GPT-2 以来,OpenAI 首次推出开源语言模型。这两款模型均可在 Hugging Face 在线开发者平台上免费下载,OpenAI 称其在多个用于比较开源模型的基准测试中表现“处于前沿水平”。 据 OpenAI 介绍,Gpt-oss-120b 模型 ...
GPT‑4.1 nano 则是 OpenAI 目前速度最快、成本最低的模型,适合需要低延迟的任务。 它同样支持 100 万 token 的上下文窗口,在MMLU、GPQA和 Aider polyglot 编程测试中的得分分别为 80.1%、50.3% 和 9.8%,均高于 GPT-4o mini,适合分类、自动补全等轻量任务。
OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上,表现超过了人类基线水平。 在基准测试时技能爆表,但一到实际应用就「掉链子」,OpenAI前首席科学家Ilya ...
今天凌晨,OpenAI 的新系列模型 GPT-4.1 如约而至。 该系列包含了三个模型,分别是GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,它们仅通过 API 调用,并已向所有开发者开放。 随着该系列模型在很多关键功能上提供了类似或更强的性能,并且成本和延迟更低,因此OpenAI 将开始 ...
GPT-5.1-Codex-Max号称最先进的智能体编码模型,周四面向付费ChatGPT用户推出。据OpenAI,新模型的SWE-Bench Pro测试准确率56.4%,高于 ...
今天凌晨,OpenAI 的新系列模型 GPT-4.1 如约而至。 该系列包含了三个模型,分别是 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,它们仅通过 API 调用,并已向所有开发者开放。 随着该系列模型在很多关键功能上提供了类似或更强的性能,并且成本和延迟更低,因此 OpenAI 将 ...
这次跨界融合的核心亮点在于 Codex 强大的“双模”作战能力:它允许开发者在云端智能体与本地编程环境之间丝滑切换,并行处理多项软件工程任务。此前,Codex 已在 VS Code 和 Cursor 等轻量级编辑器上证明了自己的实力,而此次进驻 Rider 、 Intellij IDEA 、 PyCharm 等重量级 IDE,则真正实现了从代码规划、编写到测试、发布的全流程 AI ...
OpenAI正式推出新一代人工智能模型GPT-5,该模型能自动识别何时快速响应或深入思考。GPT-5在编程、创意写作和健康咨询方面显著提升,且出现幻觉的错误信息率显著降低。OpenAI引入安全训练形式并推出四种ChatGPT聊天预设性格。此外,微软在GPT-5发布当日即宣布 ...
前言: GPT-4.5的发布被OpenAI视为[非思维链模型的最后一代],此后将转向需要长时间思考的推理模型。 这一转变与行业趋势紧密相连——自从DeepSeekR1开源引发推理热潮后,AI竞争的焦点已经从数据规模转向逻辑深度。 在2月27日,OpenAI通过一段时长为13分钟的视频 ...
在频频“跳票”和多次“剧透”之后,万众期待的GPT-5终于发布了。 北京时间8月8日凌晨1时,OpenAI举行了长达1个多小时的线上发布会,正式推出了GPT-5。与此前的模型更新直播时间短且主要由研发人员发布相比,GPT-5的发布明显规格更高,不仅发布时间长、细节 ...
这非常令人担忧。如果用户的聊天被重新路由到一个用于心理健康危机响应的模型,这说明用户正处于紧急危险之中,而大多数受影响的对话并非如此。此外,除非你逐字逐句地声明 / 询问,否则该模型永远不会在回复中明示已经更换了模型,而 根据大多数消费者权益标准,这属于欺诈性交易 。例如,在澳大利亚,这显然违反了消费者法。」 ...
前述内容由第一财经“星翼大模型”智能生成,相关AI内容力求但不保证准确性、时效性、完整性等。请用户注意甄别,第一财经不承担由此产生的任何责任。 如您有疑问或需要更多信息,可以联系我们 yonghu@yicai.com OpenAI表示,公司用了网络上的图像和文本训练 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果