关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025113人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

越挫越勇的落选秀坦普尔 如今续约猛龙迎生涯第16季

仰卧撑FTUer 浏览 204 08-22

苏超常州队主帅:明年队伍要年轻化,希望能让球迷场场都开心

懂球帝 浏览 92 09-29

稳住下半年,沃尔沃选择彻底中国化

汽车公社 浏览 1214 07-29

九三“大阅兵”重磅来袭,新一代武器装备“引爆”A股军工板块

览富财经网 浏览 238 08-21

美日同盟下的暗流:广岛阴影与日本的双重姿态

浏览 4986 07-14

首搭量产半固态电池 全新MG4预售7.38万元起

网易汽车 浏览 9550 08-06

小米SU7改配YU7 准车主后悔了:还要等41周

大象新闻 浏览 3474 07-11

东方甄选,连续暴跌

中国基金报 浏览 200 08-27

到了中年,夏天穿裤子最好避开这两种,选对了气质立马不一样

静儿时尚达人 浏览 10305 07-24

真爱大牌返场|| 回购多年的牌子,这次竟然100+就能入手

黎贝卡的异想世界 浏览 198 08-22

欧锦赛头号夺冠热门!塞尔维亚主帅:这不是约基奇和博格丹的球队

罗说NBA 浏览 257 08-19

南京爆冷无缘苏超决赛,苏州发布9个感叹号!网友:像是在放鞭炮

风过乡 浏览 37 10-19

终于如愿了!上海签古德温补强一号位,战绩有望再突破!

篮球资讯达人 浏览 7676 07-21

西甲:皇家贝蒂斯2比0奥萨苏纳

体坛周报 浏览 89 09-29

巴奴冲刺港股,餐饮投资逻辑变了

伯虎财经 浏览 1653 07-24

拒绝吉达国民4500万欧元报价,记者:扎卡里亚将会留在摩纳哥

懂球帝 浏览 222 08-20

湖南发现4.9亿吨锂矿石,还伴生多种战略矿产,是如何被发现的?揭秘来了

三湘都市报 浏览 1441 07-12

农夫山泉创新高,钟睒睒“渡劫”成功?

财视传播 浏览 4548 07-25

宗馥莉家庭被扒,父亲作风不正关系畸形

趣文说娱 浏览 12274 07-18

押注上海创新力量,达索系统中国首个开放创新实验室启用

上观新闻 浏览 222 08-23

军工血统+全栈华为 猛士M817售31.99万元起

网易汽车 浏览 202 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11