关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013319人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

救一家三口牺牲的小伙宋士佳下葬 送行队伍蜿蜒百米

极目新闻 浏览 4678 07-28

光大信托:涉荣盛3亿地产贷款逾期,能否顺利甩手?

密探财经 浏览 6988 07-29

离婚4年佟丽娅又官宣喜讯,陈思诚已高攀不起

窥史 浏览 9519 07-31

拆光了樱桃后防5人组已售1.1亿,扎巴尼离队后将仅剩34岁老将

直播吧 浏览 7146 07-30

张靓颖跳网红舞,自我放飞?还是讨好下沉市场?

策略剖析 浏览 1176 07-16

仰望U8L,不仅加长,配24K真金车标

懂车之道 浏览 229 06-02

丫蛋和师兄离婚,如今的她幸福吗

大龄女一晓彤 浏览 229 08-22

美国本月开始批量生产B61-13核炸弹 比原计划提前近1年

环球网资讯 浏览 8295 05-09

信号来了!消费基金,出现新动向!

券商中国 浏览 148 09-10

马卡:恩德里克将继续穿皇马16号球衣,他没要求穿9号球衣

懂球帝 浏览 7692 08-07

包括氢动力版本 宝马全新一代X5最新消息曝光

乐选爱车 浏览 89 09-28

五亿美元到手 巴铁迎"美国贵客"连同稀土一股脑给对方

博览历史 浏览 337 09-11

OpenAI将于北京时间8日凌晨1点举行直播活动

界面新闻 浏览 2156 08-07

爱康集团起诉"体检10年未见异常却患癌"女子:确认无责

界面新闻 浏览 8165 07-30

售15.98万起 江淮悍途PHEV/悍途EV上市

网易汽车 浏览 137 09-03

酷比魔方将推出新款 Windows 二合一 PC平板

IT之家 浏览 704 08-09

马力超1200匹 Oilstainlab HF-11官图发布

车质网 浏览 7518 07-04

中国汽车市场整合持续推进,汽车产业的未来该咋看?

江瀚视野 浏览 175 09-01

外国人将打火机带到机场隔离区 事发机场:漏检

界面新闻 浏览 4558 07-23

哈马斯谴责以总理宣扬战争言论

环球网资讯 浏览 142 09-09

激光雷达+800V下放14万市场 2026款零跑C10打破高端配置溢价规则

创作者_1470992743975 浏览 195 05-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11