关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025373人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

詹字领衔扣篮队&杜库领衔射手队!美媒:七局四胜哪支球队能赢?

直播吧 浏览 378 08-12

杰伦-格林:被交易很伤人 休斯敦是永远的家 离开那里很难过

直播吧 浏览 3247 07-12

阿里、京东、字节等争抢“新脑子”:人才背后的AI竞赛

贝壳财经 浏览 364 09-10

记者:亚马尔经纪人门德斯抵达巴萨,参加续约和10号球衣公布仪式

直播吧 浏览 3732 07-17

联手梅西!阿根廷名记埃杜:德保罗将加盟迈阿密国际,签约4年

直播吧 浏览 4864 07-17

网红夫妇中丈夫患焦虑症:5年生4胎 曾称要陪妻子结扎

鲁中晨报 浏览 3471 08-07

辽宁2将打强队太吃力!王岚嵚组织与得分全垮,付豪进攻失灵了!

篮球资讯达人 浏览 227 01-12

欧洲区小组赛出局队全部确定:塞尔维亚、匈牙利、以色列在列

懂球帝 浏览 229 11-17

史上最贵法国门将!舍瓦利耶:加盟巴黎无比自豪,这对我意义非凡

直播吧 浏览 4509 08-10

硕士杀死室友:投毒后搬离 室友抢救时他多次否认投毒

中国新闻周刊 浏览 10454 07-12

德媒:拜仁出售科曼后只租不买,监事会的决定让埃贝尔困惑

懂球帝 浏览 429 08-20

美以领导人就加沙教堂遭袭通话 以方发声明称“误击”

环球网资讯 浏览 933 07-18

全新一代问界M7申报

大象新闻 浏览 491 08-11

Motif发布12.7B模型:用小算力挑战大模型,效率与性能的"双赢"

科技行者 浏览 225 01-23

美军方暂停一个关联马斯克企业的试验项目

浏览 985 07-14

企业近2亿拍下灵宝黄金7354万股股份 付款5个月未过户

红星新闻 浏览 407 09-09

54岁中国男子在日本跳海救人:我上个月刚做锁骨手术

极目新闻 浏览 371 09-18

黄杨钿甜"天价耳环"价格一百多元 一家非过亿别墅业主

封面新闻 浏览 3230 07-17

"续面餐馆"遭"正义差评"差评率高达97% 老板:准备关店

山河月明史 浏览 531 08-19

欧豪骨子里的江湖气与角色浑然天成

呱田里的猹 浏览 327 10-12

刘嘉玲好敢说!问柯淳不谈恋爱生理没需求么?柯淳回答堪称教科书

娱乐圈笔娱君 浏览 246 11-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11