关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015435人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

反内卷的风,终于吹到集采了

智谷趋势 浏览 9732 07-26

世体:巴尔德吉已接受巴萨的季前体检,预计周一官宣

懂球帝 浏览 3794 07-14

金龟子女儿大婚,老搭档董浩“绿泡泡”捧场祝贺,何炅因工作缺席

不八卦会死星人 浏览 633 07-31

“重新上车激光雷达”?小鹏汽车副总裁:制造谣言,会严肃处理

红星资本局 浏览 2744 07-29

公职人员遭境外间谍色诱拍下私密照 回国后多次泄密

澎湃新闻 浏览 7071 07-11

4名中老年人自驾误入青海无人区失联 网友发帖救一命

极目新闻 浏览 3976 07-30

春节期间,这些“宝藏”养生方法别错过!

网易健康 浏览 1195 01-28

E句话 | 董璇的再婚对象竟然是他?

仙女事件簿 浏览 4267 07-16

托育产业升级战:3岁以下婴幼儿,该由谁照护?

虎嗅APP 浏览 418 07-17

泽连斯基宣布乌军队人事变动

新京报 浏览 4928 06-04

90后美国男子在中国当15年道士:已拿到中国"五星卡"

FM93浙江交通之声 浏览 9238 07-12

《扫毒风暴》中6位美人,于文文被谁秒杀?“大嫂”李蔓瑄赢麻了

娱乐圈笔娱君 浏览 2054 07-24

消息称下一代 6.3 英寸小直屏手机至少有 7 台

IT之家 浏览 5353 07-12

一枚“星”标,开启享界冲击高端新阶段

钛媒体APP 浏览 3443 07-17

八年累计交车不足30辆,贾跃亭还在为梦想“续命”

澎湃新闻 浏览 6486 07-21

90%靠进口?谁在“收割”中国粮

正和岛 浏览 4651 07-16

中报喜增 杭州银行赢在战略蓄力 还有啥短板?

铑财 浏览 8139 07-24

险企竞逐居家养老生态:打通“资金-服务”价值循环链,覆盖“医护住娱”等多维场景

蓝鲸Insurance 浏览 2188 07-17

乐道L90发车,蔚来打出一张“亲民牌”

雪豹财经社 浏览 2202 07-13

王晶曝张国荣坠亡内幕,疑似内地大佬许诺落空,哥哥失望加重抑郁

不八卦会死星人 浏览 8684 07-10

“开衩裤”今夏火出圈了,这样穿显高显瘦显腿长!

LinkFashion 浏览 3634 06-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11