关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025172人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

邮报:纽卡6500万镑签沃尔特马德达协议,狼队坚决不卖拉尔森

直播吧 浏览 268 08-29

半个娱乐圈为肖战包场,《得闲谨制》票房走俏,侯鸿亮鞠躬致谢

娱乐圈笔娱君 浏览 27 12-05

亚马逊历史新高!道指标普月线六连阳,中概股探底回升

第一财经资讯 浏览 85 11-01

两件大事刷屏!“924行情”即将一周年,下周市场会修复吗?

每经牛眼 浏览 178 09-22

那不勒斯训练营大名单:德布劳内、诺阿-朗入选,奥斯梅恩缺席

懂球帝 浏览 1895 07-18

美军“重返太平洋”战略:应对挑战与寻求突破

浏览 5046 07-14

女高管被老板性侵 丈夫出镜:劝离婚的人说话不经大脑

FM93浙江交通之声 浏览 222 09-20

规模创历史新高 2025浦江创新论坛共议科技未来

看看新闻Knews 浏览 160 09-22

直播间引流卖假货、申请退款即“失联”!最新曝光来了!

中国基金报 浏览 4580 08-07

继中国之后又一个亚洲国家对美国发起反击 美财长骂街

博览历史 浏览 9253 08-05

中国生育率第一城!天门出生率反转,释放了什么信号?

北向财经 浏览 265 08-20

科技、周期股分歧大!后市聚焦这些主线 →

国际金融报 浏览 5129 07-29

原生家庭,莫非是个伪概念?!

时尚COSMO 浏览 8197 06-13

关店近千家亏损近4亿,百果园想教育消费者?

网易财经 浏览 311 08-12

国乒美国大满贯收获男单、女双、混双三冠,女单、男双无缘夺冠

直播吧 浏览 6094 07-14

媒体:出轨女生拟被开除 传播视频另一方岂能逍遥法外

极目新闻 浏览 8273 07-14

大庆航空救援支队开展年度首次夜航训练

新京报 浏览 210 09-06

此前发生严重空难的印度航空宣布缩减窄体机航班数量

财联社 浏览 3423 06-23

重庆农行马建权被带走、曾任支行长3年多,系农行今年被查第10人

湘财Plus 浏览 3929 08-07

北约增兵亚太:背后的动机与中国的坚定应对

浏览 4774 07-14

荣梓衫工作室回应偏轨事件,暴力行径揭露阴暗面

二凯训猛犬 浏览 102 10-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11