OpenAI CEO山姆·奥尔特曼(Sam Altman)透露,该公司将在未来几个月内发布一个开源权重(open-weight)的人工智能模型。
奥尔特曼在社交媒体平台X上写道:“我们很高兴能在未来几个月内发布一个具备推理能力的强大开源权重语言模型。” 。
开源权重AI模型通过仅共享神经网络的预训练参数,同时保密关键开发细节,在开源和专有系统之间提供了一个中间地带。这意味着开发人员可以使用模型进行推理和微调,但他们无法访问训练代码、原始数据集或有关模型架构和方法的细节。
外媒分析认为,此举部分是为了应对中国公司DeepSeek R1模型的迅速崛起,以及Meta Llama系列模型的持续热度。
DeepSeek的R1模型于今年1月发布后不久,奥尔特曼就曾表示,在开放模型的问题上,OpenAI可能“站在了历史的错误一边”,暗示公司有可能改变方向。本周一,他表示公司一直在考虑发布开源权重模型,并补充道:“现在,我们认为这样做是必要的。”
此外,OpenAI可能希望展示其能够以较低成本训练新模型。DeepSeek的R1模型据称训练成本远低于大多数大型AI模型,这一事实也给OpenAI带来了压力。
Hugging Face联合创始人兼CEO Clement Delangue在接受采访时表示:“这太棒了!DeepSeek让大家意识到了开源权重模型的巨大潜力。”Hugging Face是一家专注于托管开源AI模型的公司。
目前,OpenAI主要通过聊天机器人和云端API提供AI服务。而R1、Llama等开源权重模型则可以免费下载并进行修改。模型的“权重”指的是神经网络中的参数值,这些值在训练过程中被设定。相比封闭模型,开源权重模型成本更低,还可以针对特定需求进行调整,例如处理高度机密的信息。
OpenAI技术团队成员Steven Heidel在X上转发了奥尔特曼的声明,并补充道:“我们将在今年发布一个可以在本地硬件上运行的模型。”
OpenAI研究员Johannes Heidecke也在X上转发了相关消息,并强调公司将进行严格测试,以确保开源权重模型不会被轻易滥用。一些AI研究人员担忧,开源权重模型可能被用于发动网络攻击,甚至开发生物或化学武器。Heidecke表示:“虽然开放模型带来了独特挑战,但我们将遵循‘安全防备框架’(Preparedness Framework),不会发布可能带来灾难性风险的模型。”
此外,OpenAI还上线了一个网页,邀请开发者申请新模型的早期测试资格。奥尔特曼透露,公司将在未来几周内举办开发者活动,展示该模型的早期原型。
Meta是最早采用开源策略的主要AI公司之一,其Llama模型的首个版本于2023年7月发布。如今,越来越多的开源权重AI模型涌现。然而,一些研究人员指出,Llama以及部分其他开源模型在透明度上仍存在问题,例如训练数据和其他技术细节仍未公开。此外,Meta还对Llama施加了许可限制,限制其他公司利用该模型进行商业化。
随着OpenAI也加入开源权重模型的竞争,这一领域的博弈正在变得更加激烈。