关闭广告

OpenAI没开源的gpt-oss基础模型，他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013390人阅读

机器之心报道

编辑：Panda

前些天，OpenAI 少见地 Open 了一回，发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是，这两个模型都是推理模型，OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而，发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法，DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日，Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习，让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

44岁网红＂包公＂离世：拎着线修漏电冰柜厨房可能有水

极目新闻浏览 6982 08-10

美国拱火，中国可将计就计，就等菲律宾上钩

浏览 1575 07-14

曼晚：曼联遗憾错失天才左后卫A-卡雷拉斯，滕哈格难辞其咎

懂球帝浏览 2834 07-16

美财长公然挑拨中阿关系:米莱承诺＂让中国退出阿根廷＂

环球网资讯浏览 101 10-13

星巴克和它所代表的一切，正与我们渐行渐远

虎嗅APP 浏览 62 11-06

飞机将降落时俩旅客打架四川机场公安：3人被行拘

界面新闻浏览 1335 07-23

比尔放弃1380万达成买断：两年1100万加盟快船哈登系幕后推手

颜小白的篮球梦浏览 1264 07-17

年薪上亿＂炫富＂清华学霸曾想反诉公司诽谤被控三项罪

红星新闻浏览 251 09-18

香港大重置

巨潮WAVE 浏览 4647 08-13

正部级吴英杰被判死缓曾被批严重影响西藏高质量发展

界面新闻浏览 3373 07-17

盘点未夺大满贯的最强选手，谁是你心中的意难平？

网球之家浏览 46 11-09

维耶里：齐沃是有新想法的年轻教练国米应给他更多时间

直播吧浏览 4577 07-18

某券商首席炒黄金期货大赚14亿？本人报警了

财通社浏览 86 10-29

女孩在团播里擦边：主持人为吸票让主播用腿夹爆气球

新京报浏览 1035 07-18

对话中金公司潘志兵：金融赋能深圳“双区”建设，推动大湾区金融市场互联互通

时代周报浏览 287 08-26

优必选联手云智汇科技加速人形机器人全球布局

财闻浏览 188 09-22

月之暗面推出新模型，业内人士：大模型低价竞争策略不会长久

澎湃新闻浏览 2766 07-15

《扫毒风暴》大结局：K哥被杀，卢少骅被判死刑，林强峰因公殉职

电和影浏览 44306 07-27

126套房产仅抵5成债务！温州银行已向上海世茂追债3年

独角金融浏览 8975 07-30

OpenAI和奥特曼将投资一家脑机接口公司，直接与Neuralink竞争

机器之心Pro 浏览 2667 08-13

深得阿杜真传？伊森上网怼空气：我场均24分钟12分只是运气好

直播吧浏览 133 09-26

OpenAI没开源的gpt-oss基础模型，他去掉强化学习逆转出来了

穆里尼奥“警...

首批玩家登“...

哈马斯：将研...

李嘉诚家族甩...

全新一代G8...

秦PLUS ...

南京开通直飞巴黎航线

曝小米汽车调整销售体系！

世锦赛男子200蛙预赛：覃海洋2分09秒96排名第4，携手董志豪晋级

44岁网红＂包公＂离世：拎着线修漏电冰柜厨房可能有水

美国拱火，中国可将计就计，就等菲律宾上钩

曼晚：曼联遗憾错失天才左后卫A-卡雷拉斯，滕哈格难辞其咎

美财长公然挑拨中阿关系:米莱承诺＂让中国退出阿根廷＂

星巴克和它所代表的一切，正与我们渐行渐远

飞机将降落时俩旅客打架四川机场公安：3人被行拘

比尔放弃1380万达成买断：两年1100万加盟快船哈登系幕后推手

年薪上亿＂炫富＂清华学霸曾想反诉公司诽谤被控三项罪

香港大重置

正部级吴英杰被判死缓曾被批严重影响西藏高质量发展

盘点未夺大满贯的最强选手，谁是你心中的意难平？

维耶里：齐沃是有新想法的年轻教练国米应给他更多时间

某券商首席炒黄金期货大赚14亿？本人报警了

女孩在团播里擦边：主持人为吸票让主播用腿夹爆气球

对话中金公司潘志兵：金融赋能深圳“双区”建设，推动大湾区金融市场互联互通

优必选联手云智汇科技加速人形机器人全球布局

月之暗面推出新模型，业内人士：大模型低价竞争策略不会长久

《扫毒风暴》大结局：K哥被杀，卢少骅被判死刑，林强峰因公殉职

126套房产仅抵5成债务！温州银行已向上海世茂追债3年

OpenAI和奥特曼将投资一家脑机接口公司，直接与Neuralink竞争

深得阿杜真传？伊森上网怼空气：我场均24分钟12分只是运气好

OpenAI没开源的gpt-oss基础模型，他去掉强化学习逆转出来了

穆里尼奥“警...

首批玩家登“...

哈马斯：将研...

李嘉诚家族甩...

全新一代G8...

秦PLUS ...

南京开通直飞巴黎航线

曝小米汽车调整销售体系！

世锦赛男子200蛙预赛：覃海洋2分09秒96排名第4，携手董志豪晋级

44岁网红＂包公＂离世：拎着线修漏电冰柜 厨房可能有水

美国拱火，中国可将计就计，就等菲律宾上钩

曼晚：曼联遗憾错失天才左后卫A-卡雷拉斯，滕哈格难辞其咎

美财长公然挑拨中阿关系:米莱承诺＂让中国退出阿根廷＂

星巴克和它所代表的一切，正与我们渐行渐远

飞机将降落时俩旅客打架 四川机场公安：3人被行拘

比尔放弃1380万达成买断：两年1100万加盟快船 哈登系幕后推手

年薪上亿＂炫富＂清华学霸曾想反诉公司诽谤 被控三项罪

香港大重置

正部级吴英杰被判死缓 曾被批严重影响西藏高质量发展

盘点未夺大满贯的最强选手，谁是你心中的意难平？

维耶里：齐沃是有新想法的年轻教练 国米应给他更多时间

某券商首席炒黄金期货大赚14亿？本人报警了

女孩在团播里擦边：主持人为吸票让主播用腿夹爆气球

对话中金公司潘志兵：金融赋能深圳“双区”建设，推动大湾区金融市场互联互通

优必选联手云智汇科技 加速人形机器人全球布局

月之暗面推出新模型，业内人士：大模型低价竞争策略不会长久

《扫毒风暴》大结局：K哥被杀，卢少骅被判死刑，林强峰因公殉职

126套房产仅抵5成债务！温州银行已向上海世茂追债3年

OpenAI和奥特曼将投资一家脑机接口公司，直接与Neuralink竞争

深得阿杜真传？伊森上网怼空气：我场均24分钟12分只是运气好

44岁网红＂包公＂离世：拎着线修漏电冰柜厨房可能有水

飞机将降落时俩旅客打架四川机场公安：3人被行拘

比尔放弃1380万达成买断：两年1100万加盟快船哈登系幕后推手

年薪上亿＂炫富＂清华学霸曾想反诉公司诽谤被控三项罪

正部级吴英杰被判死缓曾被批严重影响西藏高质量发展

维耶里：齐沃是有新想法的年轻教练国米应给他更多时间

优必选联手云智汇科技加速人形机器人全球布局