关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015953人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2025羽绒服8大流行趋势,温暖时髦过冬天!

LinkFashion 浏览 210 11-05

队记:杨瀚森被换下时受到热烈欢迎 观众席响起雷鸣般的掌声

直播吧 浏览 3237 07-12

业主买别墅小区发现顶层阁楼没顶 开发商:按图纸盖的

极目新闻 浏览 1544 07-16

闫学晶风波再次升级,娱乐圈多位明星躺着中枪,唯独一人成为赢家

徐帮阳 浏览 205 01-18

高通遭反垄断调查,国产平替芯片机会来了?

禾颜阅车 浏览 317 10-15

乌克兰将向美国买1000亿美元武器 美反对乌加入北约

总台环球资讯 浏览 491 08-20

出海速递:小鹏在印尼开启本地化生产

车质网 浏览 5634 06-28

有人被拖欠工资!毫末智行北京总部人去楼空,员工抱着显示器离开;曝ASML为美国监控中国客户!官方否认;雷军斥资超1亿港元增持小米

雷峰网 浏览 210 11-25

全尺寸货运版eVTOL样机已总装下线,「蓝霄航空」完成新一轮数千万元融资,年内累计融资近亿元|36氪首发

36氪 浏览 288 10-13

铜资源争夺加剧!力拓将向亚马逊供应铜

财联社 浏览 229 01-16

搭Flyme Auto座舱 全新吉利博越8月2日开启预售

网易汽车 浏览 1638 08-01

宁德时代:匈牙利工厂将于2026年初投产

观察者网 浏览 396 09-09

安克创新、自然堂高管坐阵,寻找AI+营销的最强落地

虎嗅APP 浏览 6890 08-07

周末两大利空!特朗普对欧盟、墨西哥加30%关税,美联储降息无望?

看财经show 浏览 6136 07-14

东体:国足选帅推进慢,足协根本做不了主

直播吧 浏览 3678 07-30

专家:他信再入狱对其家族打击巨大 东山再起难度很大

新民晚报 浏览 609 09-11

里瓦尔多:拉什福德难以取代拉菲的主力位置,后者目前是世界前五

直播吧 浏览 10183 07-26

德科:C罗是我见过最谦逊的人,他和梅西是不同类型的天才

懂球帝 浏览 347 09-29

《捕风追影》成近十年最佳动作片,成龙这一次没有令人失望!

电和影 浏览 460 08-20

麻烦大了,凤凰传奇再次遭受“重创”

访史 浏览 3696 07-09

Scotto:马刺将聘请雅各布-钱斯担任G联赛奥斯汀马刺的主帅

直播吧 浏览 403 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11