关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015408人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者:贝蒂斯代表团今天将前往墨西哥,力图敲定蒙特雷中场德奥萨

直播吧 浏览 1758 07-28

全球首次:小胶质细胞替换治疗取得突破,成功阻断致命脑疾病进展

IT之家 浏览 9660 07-13

牙齿矫正的8大流言,专家一矫到底

网易健康 浏览 1581 09-20

美媒:杰伦威&巴特勒&唐斯&穆雷 给下赛季的四位二当家进行排名

直播吧 浏览 1710 07-26

被她们美到了!缎面裙还可以这样搭

黎贝卡的异想世界 浏览 4924 07-26

阿维塔总裁陈卓:小米等跨界入局,对汽车营销形成降维打击,CMO可能将失业

红星资本局 浏览 848 07-14

南京一小区地线被偷 市民家中水龙头流出“带电的水”

扬子晚报 浏览 3840 07-11

邮报:曼联摄影师为俱乐部工作了25年,B费训练结束后祝贺他们

懂球帝 浏览 8872 07-27

方媛成功怀男胎?郭富城豪掷亿元奖励

说说史事 浏览 8684 07-09

调整巨快!杨瀚森半场两记三分砍下8分2板1助3帽!

直播吧 浏览 1003 07-16

同日宣布!京东大手笔领投三家具身智能公司

国际金融报 浏览 8255 07-22

大学生网购10套古装表演后集体退货 商家:裤裙都脏了

极目新闻 浏览 9872 06-11

变革之下,主流媒体如何重建新价值?“总编圆桌”把脉新趋势

澎湃新闻 浏览 9931 07-26

媒体:国际贸易格局变了 美国影响力正在逐渐减弱

极目新闻 浏览 3914 07-14

洛夫图斯-奇克:对我们来说,今天晚上是向前迈出的漂亮一步

懂球帝 浏览 3627 07-27

外媒称他信表态“要给洪森一个教训” 洪森回应

环球网资讯 浏览 3414 07-26

省公安厅原副厅长为涉黑团伙站台被查处 忏悔称失守了

政知新媒体 浏览 4535 07-16

号称帮HR节省70%沟通成本,智联招聘发布多智能体协同产品方案

电厂 浏览 4436 07-28

暑期档,危险了

斑马消费 浏览 5570 07-28

郭碧婷,风平浪静的姐姐

时尚COSMO 浏览 910 06-25

宋佳、高圆圆、钟楚曦最近太美了!她们的穿搭普通人也可以借鉴

LinkFashion 浏览 5963 07-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11