关闭广告

DeepSeek R2有望8月下旬发布?内部人士:不属实

澎湃新闻2025-08-14 00:00:016346人阅读

近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。

8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。

早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

不过,上述内部人士曾向记者坦言,该传言真实度不高。

此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。

5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

五角大楼完善两套对伊朗作战方案 攻击情景推演披露

红星新闻 浏览 224 01-23

《生万物》播放过半,最令人讨厌角色出炉,干的事,个个离谱

娱乐圈笔娱君 浏览 458 08-17

小饭店老板"发蛤蟆汤照片被罚45万" 已提起行政诉讼

新京报 浏览 10090 07-13

罗体:葡体坚持对尤尔曼德的要价,奥赖利的顺位在尤文心中上升

懂球帝 浏览 527 08-11

乌克兰称不需要中国提供安全保障 中方回应

澎湃新闻 浏览 443 08-23

大模型训练新突破!Meta提出LSP:无数据也能实现能力飞升

学术头条 浏览 376 09-20

但斌为什么理解不了1元喝奶茶的意义

诗与星空 浏览 3704 07-13

恩佐:对凯塞多只有钦佩之情,能在切尔西和他并肩作战很开心

懂球帝 浏览 258 11-04

张朝阳:AI让人人成为“知道分子”,但我们仍需思考丨2025世界互联网大会

红星资本局 浏览 289 11-09

即将空降!26集都市大剧来袭,蒋欣王子文领衔

娱乐圈笔娱君 浏览 196 02-04

吉比特狂赚5.69亿!创始人卢竑岩分红独揽1.28亿!

包不同 浏览 224 11-01

周年庆专场|| 我的洗漱台上,真的不能没有它

黎贝卡的异想世界 浏览 289 10-11

全球港口博弈拉警报?李嘉诚亮终极底牌了

大猫财经Pro 浏览 217 02-05

《数据周报79》:国家队对市场影响多大?

智本社 浏览 9263 07-29

保时捷出事故保险公司让报废 但只赔100万保额的一半

大象新闻 浏览 212 12-29

6旬女子2次误闯男更衣室 男子险被"看光":标识抽象

环球网资讯 浏览 3536 08-10

“喝不上”到“放心喝”,中国如何用20年打造一杯全球顶尖牛奶?

智谷趋势 浏览 3328 07-17

新款奔驰C级换“芯”,其余照旧

爱驾天下 浏览 471 06-12

农村危房翻建审批咋这么难?人民日报记者实地调查

上观新闻 浏览 220 12-15

A股重新抱团新能源

市值Observation 浏览 368 09-11

控制权转让4年纠纷仍不断,万林物流起诉前实控人二审开庭!多项旧账待厘清

时代周报 浏览 3476 08-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11