关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:020人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

万斯:美国"没兴趣"与伊朗发生长期冲突 不打算派遣地面部队

环球网资讯 浏览 7117 06-24

郭德纲现身岳云鹏演唱会,为徒儿站场

喜欢历史的阿繁 浏览 5178 07-28

乌军首次损失一架法国"幻影-2000"战机 泽连斯基发声

环球网资讯 浏览 1828 07-23

目不暇接,奥地利哈特贝格俱乐部的球衣上有30多个广告

懂球帝 浏览 832 07-21

人形机器人轻量化趋势下PEEK材料受热捧 多家上市公司透露业务新进展

财联社 浏览 0 08-07

28岁齐如意结婚细节曝光:求婚生日杀青三重合,网友:营销?

娱乐白名单 浏览 5467 07-31

杨议妻子回应杨少华去世争议:网友的眼睛是雪亮的

深圳晚报 浏览 5043 07-11

驻伊朗使馆提醒在伊中国公民尽快回国

环球网资讯 浏览 8875 06-18

从WAIC上爆火的功夫机器人,看到这家央企的具身智能「真功夫」

机器之心Pro 浏览 5737 07-29

消息称奇瑞墨甲人形机器人 9 月在国内开卖,面向普通消费者出售

IT之家 浏览 7269 07-12

从渠道困局到“黄金时代”,独立游戏大热的背后逻辑是什么?

时代周报 浏览 7334 07-29

不是你胖,是你裤子没挑对!这10条瘦到离谱!

Yuki女人故事 浏览 3911 07-06

"山姆下架好丽友派"吵上热搜 盼盼洽洽改用英文名上架

每日经济新闻 浏览 1250 07-16

稀土王牌,要失灵了吗?

智谷趋势 浏览 2982 07-29

鸿蒙智行享界品牌标识纪念品 7 月 30 日起将分批发放给车主

IT之家 浏览 4899 07-27

市值一夜蒸发600亿美元!诺和诺德预计今年业绩增长放缓,急换CEO能力挽狂澜?

猛犸资本局 浏览 10050 07-31

苹果宣布在美追加千亿投资,股价应声涨5%

网易科技报道 浏览 0 08-07

谷歌 170 亿收编 Windsurf,硅谷 「AI 挖人」白热化,99% 的钱流向 1% 的人

极客公园 浏览 7906 07-13

“开源模型验货官”Perplexity,给Kimi K2盖了个戳

硅星人 浏览 1199 07-21

杨少华去世后,干儿子发红包截图仅千元! 网友说这钱少得不像话!

科学发掘 浏览 5180 07-11

丁克50年,村上春树的太太原来这么酷

观察鉴娱 浏览 9983 07-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11