AI播客:换个方式听新闻 下载mp3
OpenAI于当地时间周四宣布推出其迄今为止最先进的AI模型GPT-5.2。同日,该公司首席执行官山姆·奥尔特曼(Sam Altman)对媒体表示,预计将在1月结束此前在内部发布的“红色代码”预警。
OpenAI表示,最新的GPT-5.2模型在生成电子表格、制作演示文稿、图像感知、代码编写以及长上下文理解等方面均优于此前版本。GPT-5.2已于周四起在OpenAI的ChatGPT聊天机器人及其应用程序接口(API)中上线。
此次发布距离OpenAI推出GPT-5.1模型仅过去数周。竞争对手Anthropic和谷歌也在上月发布了新模型,促使OpenAI宣布进入“红色代码”状态,集中力量改进ChatGPT,并暂缓其他项目。
这是一场高风险竞争的一部分。随着消费者和企业日益将AI融入日常生活和工作流程,科技巨头正竞相打造使用最广泛的模型。OpenAI寄望于其GPT系列模型来定义未来,同时也希望借此支撑公司5000亿美元的估值以及超过1.4万亿美元的计划支出。
OpenAI应用业务首席执行官菲吉·西莫(Fidji Simo)在周四的媒体简报会上表示:
“我们宣布进入红色代码,是真正向公司释放一个信号——要在某一个领域集中调配资源,这也是明确优先级、同时对其他事项进行降级的一种方式。我会说,确实有更多资源被投入到ChatGPT整体上,这有助于此次模型的发布,但这并不是它恰好在本周推出的直接原因。”
奥尔特曼周四在接受CNBC采访时则表示,谷歌发布Gemini 3模型对公司各项指标的影响低于其最初担忧。他预计OpenAI将在1月结束红色代码状态。
“我认为,当竞争威胁出现时,你就应该集中精力应对,并迅速解决。”奥尔特曼说。
OpenAI表示,GPT-5.2将提供Instant、Thinking和Pro三个版本。其中,Instant在写作和信息检索方面速度更快;Thinking更适合代码编写和规划等结构化工作;Pro则面向复杂问题,提供最准确的答案。
该公司称,GPT-5.2在多项行业基准测试中位居前列,包括用于评估代理式编程能力的SWE-Bench Pro,以及研究生水平科学推理测试GPQA Diamond。在OpenAI今年早些时候发布的评估体系GDPval中,GPT-5.2在70.9%的明确任务上击败或追平了行业顶尖专业人士。
西莫表示:“这项工作已经推进了非常非常多个月。尽管我们为能够保持较快的模型发布节奏感到自豪,但这次具体的整合早已筹划了一段时间。”
Anthropic的最新模型Opus 4.5在SWE-Bench Verified测试中的得分高于GPT-5.2。该测试用于评估AI系统的软件编程能力。OpenAI向记者表示,与SWE-Bench Pro相比,这一基准在“抗污染性、挑战性、多样性以及工业相关性”方面都较弱。
OpenAI成立于10年前,最初是一家研究实验室,但自2022年推出ChatGPT以来,已成长为全球增长最快的商业机构之一。目前,每周使用其聊天机器人的用户已超过8亿人。