关闭广告

月之暗面发布并开源Kimi K2模型

环球网资讯2025-07-12 12:00:028996人阅读

来源:环球网

【环球网科技综合报道】7月12日消息,月之暗面于昨日正式发布Kimi K2模型,并同步宣布开源。该模型作为一款采用MoE架构的基础模型,总参数达1T,激活参数为32B,在代码能力与通用Agent任务处理方面表现突出。


在技术性能上,Kimi K2模型展现出强劲实力。在SWE Bench Verified、Tau2、AceBench等多项基准性能测试中,该模型均取得开源模型中的最优成绩,充分彰显了其在代码、Agent及数学推理任务上的领先水平。值得关注的是,在预训练阶段,Kimi K2采用MuonClip优化器,实现了万亿参数模型的稳定高效训练。在当前人类高质量数据成为发展瓶颈的背景下,这一技术有效提升了Token利用效率,为模型找到新的Scaling空间。尤其在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

在美国卖酱香饼的中国小伙开直播:花了3万美金已保释

都市现场 浏览 1261 07-21

仅剩2家!贵州白酒上市后备军“大瘦身”,茅台镇第二大酒企国台也“落榜”

时代周报 浏览 899 07-13

顶流!NBA官方发杨瀚森助攻集锦 多家美媒纷纷转发

直播吧 浏览 8130 07-13

林诗栋不敌张本智和,王楚钦将与张本智和争夺美国大满贯冠军

澎湃新闻 浏览 9701 07-13

美商务部长:特朗普几乎每晚1点都给我打电话

环球时报新闻 浏览 5665 07-23

苹果首款OLED MacBook Pro恐延至2027年发布

IT之家 浏览 1483 07-12

日本网红当上议员 曾多次污蔑中国游客大喊"滚出日本"

上游新闻 浏览 7287 07-26

特朗普赌“国运”,“通吃”还是加速解体?

浏览 3102 07-14

以军证实对伊朗核计划发动空袭:伊朗有足够的浓缩铀

财联社 浏览 5447 06-13

令人振奋!中国天空新巨兽出世!瞬间就爽了

浏览 8411 07-14

特斯拉周四股价大跌8%,马斯克罕见示弱

网易科技报道 浏览 1304 07-25

AI教父辛顿现身上海:人类如何不被AI杀掉

态℃ 浏览 8575 07-27

伊朗发布导弹射程内美军基地地图 回应近期美空袭威胁

央视新闻客户端 浏览 4250 06-20

法律人士谈发蛤蟆汤照片收45万罚单:不构成广告行为

新京报 浏览 1400 07-15

助听器到底会不会越戴越聋?

网易健康 浏览 9389 03-06

数据显示SpaceX星舰基地员工受伤率居高不下,远超行业平均水平

IT之家 浏览 1539 07-21

科技巨头“挖人战”白热化!谷歌、Meta同日出手扩张AI版图

财联社 浏览 9565 07-13

饿了么前CEO韩鎏等人受贿 涉案金额达4000余万

红星新闻 浏览 7126 07-26

欧阳娜娜恋情?男方为大6岁乐队鼓手

情感大头说说 浏览 4526 07-23

胡塞武装称使用高超音速导弹袭击以色列

上观新闻 浏览 8037 07-03

董璇再婚首露面竟不带老公!佟丽娅揭露真相

传递满满正能量 浏览 358 07-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11