关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013390人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

44岁网红"包公"离世:拎着线修漏电冰柜 厨房可能有水

极目新闻 浏览 6982 08-10

美国拱火,中国可将计就计,就等菲律宾上钩

浏览 1575 07-14

曼晚:曼联遗憾错失天才左后卫A-卡雷拉斯,滕哈格难辞其咎

懂球帝 浏览 2834 07-16

美财长公然挑拨中阿关系:米莱承诺"让中国退出阿根廷"

环球网资讯 浏览 101 10-13

星巴克和它所代表的一切,正与我们渐行渐远

虎嗅APP 浏览 62 11-06

飞机将降落时俩旅客打架 四川机场公安:3人被行拘

界面新闻 浏览 1335 07-23

比尔放弃1380万达成买断:两年1100万加盟快船 哈登系幕后推手

颜小白的篮球梦 浏览 1264 07-17

年薪上亿"炫富"清华学霸曾想反诉公司诽谤 被控三项罪

红星新闻 浏览 251 09-18

香港大重置

巨潮WAVE 浏览 4647 08-13

正部级吴英杰被判死缓 曾被批严重影响西藏高质量发展

界面新闻 浏览 3373 07-17

盘点未夺大满贯的最强选手,谁是你心中的意难平?

网球之家 浏览 46 11-09

维耶里:齐沃是有新想法的年轻教练 国米应给他更多时间

直播吧 浏览 4577 07-18

某券商首席炒黄金期货大赚14亿?本人报警了

财通社 浏览 86 10-29

女孩在团播里擦边:主持人为吸票让主播用腿夹爆气球

新京报 浏览 1035 07-18

对话中金公司潘志兵:金融赋能深圳“双区”建设,推动大湾区金融市场互联互通

时代周报 浏览 287 08-26

优必选联手云智汇科技 加速人形机器人全球布局

财闻 浏览 188 09-22

月之暗面推出新模型,业内人士:大模型低价竞争策略不会长久

澎湃新闻 浏览 2766 07-15

《扫毒风暴》大结局:K哥被杀,卢少骅被判死刑,林强峰因公殉职

电和影 浏览 44306 07-27

126套房产仅抵5成债务!温州银行已向上海世茂追债3年

独角金融 浏览 8975 07-30

OpenAI和奥特曼将投资一家脑机接口公司,直接与Neuralink竞争

机器之心Pro 浏览 2667 08-13

深得阿杜真传?伊森上网怼空气:我场均24分钟12分只是运气好

直播吧 浏览 133 09-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11