关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025171人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

金莲花奖女配提名 85花顶流之争再升级

桑葚爱动画 浏览 26 12-02

女子开奔驰逼停摩托车并下车猛踹其尾箱 警方再通报

界面新闻 浏览 298 08-22

郭碧婷爸爸“打脸”向太:郭碧婷一人承担俩孩子开销

青途历史 浏览 98 10-19

五角大楼当面喝退英航母!百年盟友裂痕显现

浏览 1526 07-14

足球报:三镇8轮不胜保级警钟再次拉响 俱乐部目前为止并没有欠薪

直播吧 浏览 251 08-26

小米辟谣"雷军向海外转50亿美金"

每日经济新闻 浏览 22550 08-09

半两财经|首款eSIM手机发售 国内运营商加速“无卡化”

北青网-北京青年报 浏览 104 10-23

离开妈妈黄圣依半年的安迪 在杨子照顾下邋里邋遢

老吴教育课堂 浏览 1122 07-28

六大女星同框比美!身材越好越抢眼,关晓彤不及娜扎输在没锁骨

萌神木木 浏览 3172 07-30

郭富城三胎得女,四大天王未能迎来首个男孩,压力又给到郭富城了

扒虾侃娱 浏览 91 10-23

泰晤士:里昂有意泰勒-莫顿,已与利物浦接触

懂球帝 浏览 2721 07-30

这是什么?瓜迪奥拉左脸颊有一块白色

直播吧 浏览 159 09-22

报告:中美人工智能发展差距缩小,全球大模型数量增长放缓

南方都市报 浏览 773 07-27

大疆首款全景无人机谍照首曝,有望年内发布

IT之家 浏览 197 09-09

吴易昺赛季首进八强喜提中网外卡,孙发京外卡取消最终获益者揭晓

网球之家 浏览 156 09-21

法拉第未来官宣10月8日交付下一台 FF 91 2.0 Futurist Alliance

IT之家 浏览 186 09-26

王心凌吴克群被偶遇,曾多次合体同游逛街,被扒出多个同款饰品

扒虾侃娱 浏览 34 11-25

特朗普:普京已经厌倦了 他们都厌倦了

环球网资讯 浏览 847 08-20

养老金增速领跑 险资投资版图更新

北京商报 浏览 31 11-25

63岁港星自曝当年离婚分身家没工作零收入

TVB剧评社 浏览 201 09-06

阿维塔第21万辆正式下线

三言科技 浏览 73 10-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11