关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015956人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

燃油车的“智能”反击!2025广州车展燃油新车盘点

车市红点 浏览 227 11-25

美媒:中国近半年没买过美国一粒大豆 豆农心急如焚

CCTV4 浏览 233 10-09

记者:联赛结束后海港队的人就说过,申花队要买拉斐尔-拉唐

懂球帝 浏览 180 12-16

乔治亚理工和微软团队重磅推出:让AI推理更聪明的"思维开关"技术

科技行者 浏览 253 11-04

特朗普弄混格陵兰岛与冰岛 再提北约秘书长叫他"爸爸"

鲁中晨报 浏览 224 01-23

Model Y L来了!特斯拉发布六座SUV,售价33.9万元起

文汇报 浏览 457 08-19

50岁陈紫函给1米7婆婆染粉色头发,站一起像姐妹

银河史记 浏览 10154 07-13

媒体:执政半年 李在明抓住了一个关键窗口期

澎湃新闻 浏览 253 01-07

王腾翻车,给“网红”雷军敲响警钟!

功夫财经 浏览 422 09-11

莱因克尔:对阵勒沃库森时哈弗茨应首发,他能提供更多东西

懂球帝 浏览 137 03-17

小米卢伟冰:相信Q4手机毛利率会回升,将增加AI和自研芯片投入

IT之家 浏览 433 08-20

全球关税违法+库克可能败诉

路财主 浏览 468 09-01

联合国安理会通过决议,将对海地制裁延期一年

界面新闻 浏览 222 10-18

贵州茅台的盈利会下降吗?

锦缎研究院 浏览 223 01-06

记者:原梅州客家主帅里斯蒂奇将接任李霄鹏,执教青岛海牛

懂球帝 浏览 247 12-21

高温来袭小心中暑,4步急救法请收好

人民网 浏览 7099 07-08

这次“不偷不抢”的周深 给张碧晨上了一课

洲洲影视娱评 浏览 2551 07-30

从《小巷人家》到《以法之名》,44岁李光洁再次让所有人惊艳!

娱乐白名单 浏览 1867 07-11

消息称华为、三星新品三折叠手机9月左右发布,同台竞争高端市场

IT之家 浏览 5794 07-28

王浩然第二阶段再进步!展露持球和突破能力,若补强防守还了得?

篮球资讯达人 浏览 119 04-10

被追问爱泼斯坦案 特朗普开怼:克林顿去过小岛28次

环球网资讯 浏览 8524 07-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11