关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025375人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

我把AI当辅助,AI删我数据库

量子位 浏览 4767 07-24

"霉霉"男友父亲透露儿子求婚细节:场面很浪漫

红星新闻 浏览 377 08-28

万斯称美国正考虑向乌克兰提供“战斧”导弹

央视新闻客户端 浏览 297 09-29

纳斯达克向SEC提交提案 拟上线代币化证券交易

格隆汇APP 浏览 291 09-09

担心孩子孤独症,如何在家尽早发现?专家教你识别

网易健康 浏览 6089 06-03

许荔莎许凯恋爱时间线曝光 信息量超大

扒虾侃娱 浏览 463 08-23

二排座椅配按摩 新款领克09四驱探索版限时价19.88万起

网易汽车 浏览 297 10-24

剑南春|国米2-1客胜维罗纳,泽林斯基破门,皮奥造乌龙绝杀

懂球帝 浏览 267 11-03

阿尔特曼,要做脑机接口了

智东西 浏览 2216 08-13

天空:森林已致函热刺和吉布斯怀特的经纪人,威胁要采取法律行动

直播吧 浏览 3294 07-16

小S今年复出无望!好友曝其可能明年2月后回归,女儿反倒开工了

萌神木木 浏览 380 08-26

61岁朱军近况曝光!扎根甘肃成治沙“老把式”

代军哥哥谈娱乐 浏览 226 01-10

疑科考队员公开出售"北极海水":全国仅100瓶 卖9999元

封面新闻 浏览 5513 08-09

记者:摩纳哥有意纽卡边后卫特里皮尔,但纽卡不希望他离队

直播吧 浏览 467 08-12

雷军辟谣:小米SU3渲染图肯定是假的 目前还没有规划

太平洋汽车 浏览 132 01-08

赵雅芝儿子被曝光,颜值身材秒杀小鲜肉!

午后拿铁 浏览 386 09-10

记者:巴萨更衣室和教练组中有人对特狮担任队长一职存在异议

懂球帝 浏览 7273 07-31

哈马斯证实其军事领导人辛瓦尔已死亡

极目新闻 浏览 346 08-31

媒体:将"台独"恶果甩锅"黑天鹅" 赖清德刷新无耻下限

环球网资讯 浏览 482 09-07

佩林卡:希望东契奇专注于欧锦赛 之后把注意力转到湖人带队夺冠

直播吧 浏览 384 08-28

问界M7改款、小鹏首款增程亮相!这批申报新车太有料了

电车通 浏览 2319 08-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11