关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015957人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体人:2K中距离评分杜兰特居然不是第一 麦克布莱德上面有人?

直播吧 浏览 3066 08-12

新加坡总理:台湾问题是"中国红线中的红线"

澎湃新闻 浏览 465 09-21

90天谈判期“徒劳无功”,特朗普急了

华尔街见闻官方 浏览 4407 07-14

太空旅游何时成行

中国经济网 浏览 376 09-15

减重版司美格鲁肽正式上市!

网易健康 浏览 10040 11-27

河北公务员,干出200亿乳品王国

创业家 浏览 199 01-29

大S去世细节曝光 泡温泉致病情恶化

素素娱乐 浏览 200 02-05

美媒披露普京停火条件:基辅必须彻底放弃顿涅茨克

参考消息 浏览 303 10-20

光伏反内卷会议:细节探讨将在今明两天展开

第一财经资讯 浏览 447 08-20

有气质的女人夏天更爱穿裙子,这些裙装穿搭,每一套都很出彩

静儿时尚达人 浏览 398 09-10

女子称彩超漏诊婴儿唇腭裂 到卫健委反映问题遭怒斥

三湘都市报 浏览 3401 08-05

旧金山大停电,谷歌无人车Waymo乱作一团,特斯拉赢麻了

华尔街见闻官方 浏览 203 12-23

亏了1800万,分红1.3个亿!网红牙膏,凭啥上市?

蓝鲸新闻 浏览 108 04-10

67032人,横滨水手vs利物浦上座人数创J联赛球队主场纪录

懂球帝 浏览 2747 07-31

央视主持杨澜:嫁百亿身家老公,57岁却直播卖课

冷紫葉 浏览 262 10-19

特朗普公开对伊开战真正原因

极目新闻 浏览 79 04-22

成都"隐形富豪"被查:名下只有两间铺子,却赚得比王健林还多

壹只灰鸽子 浏览 3590 07-26

字节跳动:因组织调整离职的员工 过渡补贴最高7.2万元

澎湃新闻 浏览 306 10-11

英国防大臣称访乌克兰途中 专列险被俄“榛树”导弹命中

红星新闻 浏览 221 01-14

9岁网球女孩晒成"老抽色" 爸爸:光线问题 肤色健康

潇湘晨报 浏览 6258 07-24

泽连斯基:若不能及时获得资金 将大幅削减无人机生产

每日经济新闻 浏览 231 12-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11