关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013391人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

装备方队唯一"女教头"带男兵训练 又被补充到受阅队伍

扬子晚报 浏览 207 09-05

外媒:为了"讨好特朗普" 欧盟对中国采取更强硬立场

澎湃新闻 浏览 237 09-21

贵阳市长与霍启刚、彭维勇、郭晶晶座谈

政知新媒体 浏览 4874 07-14

男子8001元捡漏网拍劳力士后商家拒发货 起诉获赔7万

大风新闻 浏览 37185 09-19

午评:创业板指冲高回落涨1.14% 算力硬件概念股集体大涨

网易财经 浏览 209 09-10

捷途梁海明:“四个坚持”破局 用户共创+战略深化启新程

网易汽车 浏览 30 11-25

28亿天价索赔!A股房企向创始人跨国追债

网易财经 浏览 2525 07-26

《克莱默夫妇》导演罗伯特·本顿逝世 享年92岁

界面新闻 浏览 1045 05-14

乘凉的老年人,涌入快餐店

餐饮老板内参 浏览 8858 07-24

新型电池充电12分钟可续航800公里

财联社 浏览 164 09-09

戴维-詹姆斯:意外多纳鲁马的处境;相较于法甲他更适合踢大赛

懂球帝 浏览 5916 08-14

iPhone17来了!华强北最新实探

中国基金报 浏览 178 09-22

特朗普称美国已恢复与乌克兰共享情报

浏览 6087 07-14

"武大图书馆性骚扰事件"一审宣判:不能认定男生性骚扰

封面新闻 浏览 1875 07-26

邦本宜裕:给自己本赛季表现打100分,本来想完成20个助攻

懂球帝 浏览 52 11-10

20万内唯一中大型插混MPV 星海V9登陆慕尼黑车展

网易汽车 浏览 226 09-10

李若彤、郑秀文低能量时期的“处方”!停滞时不妨试试它

黎贝卡的异想世界 浏览 1432 07-05

揭秘炎症性肠病十大真相!科学守护好您的肠道健康

网易健康 浏览 5143 05-20

高学历送外卖有何不可

中国商报 浏览 3831 07-16

17个街道年投入逾亿元 资质错配、服务动力不足何解?

南方都市报 浏览 7 12-15

C罗赛后发文庆祝大胜:三战全胜,我们想要更多!

懂球帝 浏览 196 09-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11