关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025175人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小红书对着B站“贴脸开大”

经济观察报 浏览 5948 08-11

记者:巴顿、谢维军和孙铭谦都做了核磁,孙铭谦至少歇10多天

懂球帝 浏览 130 10-02

库里教妹卡梅隆-布林克今日复出!此前因ACL伤停13个月

直播吧 浏览 5619 07-30

【IT之家开箱】口袋中的完全体哈苏:OPPO 哈苏专业影像套装图赏

IT之家 浏览 116 10-13

外交部回应"APEC会议期间中美元首是否举行会晤"

界面新闻 浏览 97 10-25

普京的专机还没起飞 美欧统一步调最低要求也不答应

掌青说历史 浏览 456 08-11

歼-10C、歼-16等机型展开夜间对抗训练

环球网资讯 浏览 9648 05-28

小萨博尼斯适合勇士吗? 三大缺点阻碍他加盟

仰卧撑FTUer 浏览 11 12-15

新车市场企稳传导效应显现 二手车市场“回暖”6月同比增长9.12%

中国经营报 浏览 2899 08-10

豪掷近5000万买豪宅,曾被马云看重的男人身家68亿

雷达财经 浏览 79 10-29

MIT满分学霸CEO反手毁约,OpenAI天塌了!谷歌半路截胡30亿天价收购

新智元 浏览 8373 07-12

狂揽四金成MVP,18岁天才少女领奖台"冷脸"

界外编辑部 浏览 7870 08-06

金正恩:朝鲜和韩国绝对不会合并成一个国家

界面新闻 浏览 189 09-23

64岁费翔泪崩:钱买不来幸福!给年轻人提了个醒

诗意世界 浏览 865 07-27

用AI“爆改”草莓工厂,第五届“多多农研科技大赛”初赛四强出炉

银柿财经 浏览 8051 07-21

姚期智:我们建成了世界上最好的量子实验室之一

上观新闻 浏览 176 09-22

净利下跌73%,市值蒸发三分之二,洽洽食品能否重拾王座?

博望财经 浏览 290 08-26

“得黄金ETF者得天下”!这类ETF单周狂揽410亿元,两家公募成大赢家丨ETF规模周报

每经牛眼 浏览 112 10-19

白宫公布"特朗普与普京通话"照 万斯和鲁比奥在场旁听

环球网资讯 浏览 281 08-20

罗永浩进军新赛道:“9 年磨一面”的“特别特鲜泡面”今晚登场

IT之家 浏览 286 08-21

TA记者:罗马在维拉边锋利昂-贝利的追逐战中处于领先地位

直播吧 浏览 1231 08-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11