OpenAI再次“Open”,开源模型GPT-oss有什么可以学?

音符科技网

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

过去几个月,OpenAI没有出现过什么激动人心的好新闻:新模型不再惊艳、重要人才流失,就连斥巨资想要收购的明星创业公司Windsurf,也被谷歌截了胡。

但这些问题还是要回到根本层面来解决,比如说再次发布一个足以受到普遍认可的新模型——这就是GPT-oss在这个节点出现的意义之一。

图片来源:OpenAI官网

8月6日凌晨,OpenAI宣布推出开源推理模型Gpt-oss,包含Gpt-oss-120B(激活参数5.1B)和Gpt-oss-20B(激活参数3.6B)两个参数大小,支持上下文128K。值得注意的是,这是OpenAI时隔六年再次开放权重。

从性能表现上来说,Gpt-oss-120B模型在核心推理基准测试中与OpenAI o4-mini几乎持平,Gpt-oss-20B则与OpenAI o3-mini取得类似结果。 

图片来源:OpenAI官网

就国产模型而言,综合公开数据,两款模型对比DeepSeek-R1、通义千问(Qwen3-235B-A22B)、智谱GLM4.5-Air、月之暗面Kimi K2等,除了个别维度,在AIME24/25、GPQA、MMLU等常规基准测试上普遍表现更好。

不仅如此,Gpt-oss-120B据称能够在单个80GB GPU上运行,Gpt-oss-20B可在仅配备16GB内存的设备上运行,这意味着两款模型或将迅速占领端侧设备本地推理的需求市场。

OpenAI还开门见山说明了两款模型均采用Apache 2.0许可证,也就是既可商用也可改造,基本没有使用限制。

开源决策与性能表现之外,本地部署的高效是Gpt-oss此次赢得业界认可的主要原因。 

OpenAI提到,两款模型的权重均可在Hugging Face上免费下载,且在后期训练阶段已原生量化为MXFP4格式——Mixed Format 4-bit Precision,是一种专为大模型推理打造的混合精度量化格式,目的在于保留关键信息的同时,把参数用更聪明的方式压缩成低精度。 

对比更为常见的FP16、FP8等,MXFP4能够在接近8-bit量化效果的同时,保留4-bit低精度量化速度快、内存小的特性,综合达成更好的模型性能表现。也就是说,它将一个“满血版”推理模型的本地部署门槛又大幅降低了。

一名AI领域实验室研究人员对界面新闻记者表示,他在本地部署了20B版本的Gpt-oss后,直接替换了同样本地部署的Gemma 3(12B),理由就是前者“快很多”,基本可以每秒输出45个token左右,而Gemma 3的速度在每秒30个token左右。并且在一些基础的思考题上,OpenAI可以给出更标准的答案。

他没有给予Gpt-oss过高的评价,因为现阶段的大模型彼此之间的性能差异已经很小,“谁免费,谁快,我就用谁。

不过,凭借Gpt-oss这款模型,OpenAI可能还是把DeepSeek-R1出现之后,它在开源世界缺乏的声量弥补了一些回来,也顺带轻轻回击了“CloseAI”这个持续已久的昵称。

复旦大学计算机科学技术学院教授张奇对界面新闻记者表示,根据其内部评测,他认为Gpt-oss在效果层面领先目前的DeepSeek和Qwen,这体现的还是OpenAI对模型的理论理解能力以及工程实现能力。 

他同时指出,这也说明了一个问题,即OpenAI还是没有从模型架构上实现巨大突破,而按照现有架构去实现AGI几乎没有可能性。

大模型成为全球科技领域焦点以来,中美之间的闭源模型竞争一直是更核心的话题,直到DeepSeek将开源模型的地位推至新高。而OpenAI在Gpt-oss上的补课,明显对既有局面有所扭转。眼下,国产开源模型可能有新的内功可供学习打磨了。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 从一台机器人看制造业向新而行
  • 宝鸡疫情最新消息今天新增了15例(宝鸡疫情最新消息分布图)
  • 尺素金声丨中国出口增长,是比较优势和全球需求共同作用的结果
  • 【江山市疫情最新情况/江山市4例疫情】
  • 尾盘:道指上涨逾200点 纳指上涨1%
  • 【哈尔滨市疫情最新消息,哈尔滨市疫情最新消息?】
  • 嘉兴疫情最新消息情况,嘉兴疫情最新消息情况今天
  • 究竟是否占领加沙地带,以总理再发声
  • 中国海油宣布圭亚那Yellowtail项目已提前投产
  • 关于冬奥会闭幕式8点开始的信息
  • 【宝鸡市最新疫情,宝鸡最新疫情信息】
  • 拓维信息:股东及部分高管拟合计减持不超1.0112%公司股份
  • 【浦东疫情最新情况/浦东役情最新消息】
  • 白宫将澄清有关黄金关税的错误信息
  • 中原高速:上半年归母净利润6.63亿元,同比增长7.68%
  • 伦敦金银市场协会:寻求澄清美国海关近期“对等关税”裁决
  • 广东宏大:子公司拟10.2亿元收购大连长之琳60%股权
  • 厦门疫情已基本控制/厦门疫情管控升级
  • 桂发祥:上半年归母净亏损391.97万元,同比转亏
  • 衢州疫情最新情况发布(衢州病情最新消息)
  • 【甘肃疫情最新通报/甘肃疫情最新情况新增9人】
  • 这所大学九年跨越九省六次迀校,镌刻“永不消逝的校址”
  • 黑芝麻:广旅大健康拟受让20%股份成公司控股股东,股票复牌
  • 我国成功发射吉利星座04组卫星
  • 巨星传奇:预期上半年综合溢利同比减少约67%
  • 郑州发布14号通告,郑州市14号疫情消息
  • 【郑州通报5例感染者轨迹4人为小学生/郑州感染事件】
  • 纽约州警告预算缺口达340亿美元 为2009年金融危机以来最大
  • 欧洲股市录得5月以来最佳单周表现 俄乌停火希望升温
  • 疫情最新数据统计,疫情最新数据统计表
  • 白宫官员:美俄元首会晤暂定于下周末举行
  • 苍南疫情最新消息/苍南疫情最新消息2021
  • 特朗普政府准备让房利美和房地美首次公开募股
  • 美媒:关税生效之际不确定性加剧美国经济或面临持续性侵蚀
  • 报道:特朗普政府寻求与加州大学洛杉矶分校达成10亿美元和解协议
  • 水利部:全力为甘肃兰州市榆中县山洪灾害抢险救援提供支持
  • 成都世运会契合中国体育时代之需用多样、多元诠释运动无限可能
  • 特斯拉获批德州网约车牌照 为Robotaxi运营铺平道路
  • 尽管受恶劣天气影响 2025年法国葡萄酒产量或同比增17%
  • “造神”诱惑叠加无竞业束缚 大批量化人才出走华尔街涌向AI初创公司
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码