关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025377人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

莫迪一步不让美印彻底翻脸 印"深远一击"美元霸权告急

博览历史 浏览 3614 08-13

京东外卖宣布投20亿给全职骑手福利,还要配15万台二轮车

网易科技报道 浏览 4434 07-16

30.98万起交个朋友!2026款小鹏X9纯电版首搭第二代VLA上市

网易汽车 浏览 166 03-03

工作“牵头”,沉默的靶心!

识局 浏览 205 02-04

小区车位被"僵尸车"霸占:居民窝火 物业怕被讹不敢动

看看新闻Knews 浏览 4686 07-14

影石创始人谈「杀入无人机市场」:存在市场增量空间、尊重大疆但将与之竞争;李想:第一眼看到i8我都觉得丑;索尼起诉腾讯新游「抄袭」

雷峰网 浏览 2206 07-30

德约科维奇闭关备战地点被发现,今天将空降纽约训练

网球之家 浏览 428 08-19

李湘王岳伦合体露面被偶遇,离婚后仍相处融洽,两人身材很富态

扒虾侃娱 浏览 288 10-27

中兴通讯一次开源11个核心成果,平治信息实力赋能AI“国家队”

览富财经网 浏览 5942 07-31

可城可野,智在从容!猛士M817 Max+如何重新定义出行自由

道哥说车 浏览 377 09-30

岚图汽车CEO卢放:岚图上市展现东风汽车转型决心,未来所有车型都会搭载华为技术

红星资本局 浏览 485 09-01

拨开“价格迷雾”,途胜L让每一分投入都清晰可感

大众侃车 浏览 450 08-23

尹锡悦再度被捕:10平米房间里"打地铺" 或面临死刑

新华社 浏览 10572 07-11

上半年营收利润双下滑,“苏酒老二”今世缘150亿目标悬了?

尺度商业 浏览 390 09-02

掉出股份行第一梯队的浦发银行 2.95亿存款”失踪”未赔

中国经济网 浏览 10633 07-21

小米汽车回应YU7赛道测试时刹车片起火

中新经纬 浏览 5267 06-30

什么信号?有银行直接5.5折卖房

大猫财经Pro 浏览 206 11-11

韩红没等来一句道歉,如今连坐椅子都成了“错”

TVB的四小花 浏览 366 09-26

制造商主动揭开骗局 港府饮用水供应商冒用品牌被拘捕

南方都市报 浏览 448 08-21

涉韩企在华芯片生产,美国提出“妥协”方案

环球网资讯 浏览 438 09-09

航母“弹射三连”释放哪些信号

经济日报 浏览 359 09-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11