关闭广告

Kimi深夜整活,开源了首个万亿参数模型

网易科技报道2025-07-13 00:00:015774人阅读

7月11日晚,月之暗面宣布正式发布新一代基础模型 K2,并同步开源。该模型采用稀疏激活(MoE)架构,总参数1T,激活参数32B。

据悉,Kimi K2具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,在 SWE Bench Verified、Tau2、AceBench 等多个权威基准测试中取得当前开源模型中的最佳成绩(),在数学推理与复杂任务理解方面也表现优异。


据介绍,该模型训练过程中采用 MuonClip 优化器,有效解决大参数量模型的稳定训练问题,提升 token 利用效率,在优质数据稀缺的背景下进一步拓展 Scaling 上限。

技术上,Kimi K2结合大规模 Agentic Tool Use 数据合成、自我评价机制下的通用强化学习等方法,构建起更具泛化能力的推理引擎。月之暗表示,Kimi K2是构建通用 Agent 的关键基石,未来还将加入思考与多模态能力。

目前,Kimi K2模型已集成至 Kimi App 与官网平台,并提供 API 接入服务。API 兼容 OpenAI 与 Anthropic 的 Chat 接口,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

21书评|专访投资人羊东:为孩子埋下商业思维的种子

21世纪经济报道 浏览 5679 08-14

取消14天年假的公司道歉,是企业太任性,还是员工不懂事?

北向财经 浏览 139 10-02

小鹏汽车季报图解:营收183亿,经营亏损9.3亿 交付103181辆车

雷递 浏览 258 08-20

古希腊掌管腿细的神!今夏最火的4双鞋子,拯救短粗腿!

Yuki女人故事 浏览 2262 06-26

AI和AV一看就有亲戚

星球商业评论 浏览 277 08-20

速卖通:巴西海外仓销售额大涨400%

网易科技报道 浏览 579 07-16

量化VS主观,近三年业绩孰强?百亿量化领跑!

私募排排网 浏览 9544 07-30

沪漂小伙带残障父母庆生 陌生人帮买单:我女儿听哭了

新闻晨报 浏览 160 09-19

被大空头狙击的明星AI股Palantir,华尔街怎么看

第一财经资讯 浏览 44 11-10

娜扎被抢休息室,网友扒出疑似林允

萌神木木 浏览 101 10-13

美国运营商AOL宣布9月30日正式废除拨号上网

IT之家 浏览 310 08-11

文章新女友身份曝光,外貌酷似李小冉,知情网友称女方去年才离婚

萌神木木 浏览 3325 08-13

百度暗藏了一支1200人的劲旅

虎嗅APP 浏览 271 08-25

全球都在涨,新手怎么上车?

简七理财 浏览 265 08-23

创意惹争议 始祖鸟该反思些什么

铑财 浏览 145 09-26

SZ002016竟敢追着黑老大要债

老斯基财经 浏览 10170 08-07

中国联通上半年业绩:营收净利增速显著放缓,但多项指标居于行业首位

时代周报 浏览 6749 08-14

曼联开局:5轮7分负曼城+阿森纳但胜切尔西,联赛杯爆冷出局

直播吧 浏览 163 09-21

NBA新赛季大前锋TOP10:字母一枝独秀 浓眉盼健康

体坛周报 浏览 105 10-21

歌手杨丞琳发文报平安,称刚完成一场不小的手术

烟云过眼 浏览 222 09-01

三地冲刺万亿城市,其中一个更特殊!

国是直通车 浏览 9497 08-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11