关闭广告

美团杀入开源大模型混战:LongCat登场,推理速度直破100 Token/s

AI寒武纪2025-09-01 00:00:01191人阅读


美团也推出一款名为 LongCat-Flash 的非推理开源(MIT)大模型,总参数量为 5600亿, MoE架构,激活 186亿至313亿参数(平均约270亿),模型性能看起来还是很不错的,尤其在智能体(Agentic)任务方面表现突出


一大看点是模型采用了 shortcut-connected 架构,扩展了计算与通信的重叠窗口,使推理能够在成本可控的情况下达到每秒100 Token 以上,我刚试了一下速度真的超快

体验地址:

https://longcat.ai

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

午评:创业板指半日跌0.52% 芯片股逆势大涨

网易财经 浏览 6256 08-07

特普或在中国阅兵活动当天会面 有专家提议邀请日首相

新民周刊 浏览 9153 07-30

糊了22年,他终于凭借「性张力」火了

独立鱼 浏览 95 10-27

"-86℃冰杯"咖啡爆火有人排队1个小时 店员戴手套取杯

红星新闻 浏览 4692 07-16

嘎子哥名下4家公司均已注销

金融界 浏览 248 08-26

以数字化锻造发展引擎!财信证券书写“五篇大文章”

券商中国 浏览 104 10-16

中国大规模减持美债 一个月抛了超1800亿元

每日经济新闻 浏览 195 09-21

高价墓地,突然卖不动了

智谷趋势 浏览 174 09-21

陈红与前夫恩怨太狗血!男方曾出轨知名女主持,怒闯闺房埋下祸根

萌神木木 浏览 172 09-26

李斌被告!蔚来被指虚增收入和利润,港股闪崩13%

深蓝财经 浏览 99 10-17

三伏天里排寒湿,不妨试试6款药膳茶饮

人民网 浏览 1019 08-05

美2.4万吨军舰突发火灾烧了12小时 反复请求日方支援

每日经济新闻 浏览 298 08-22

05后星二代“四大顶流”,为什么是她们?

仙女事件簿 浏览 123 10-11

前妻许婧晒外籍丈夫后,陈赫终于高调秀恩爱

阿废冷眼观察所 浏览 115 10-13

以色列总理要求卡塔尔驱逐哈马斯领导人 卡塔尔谴责

环球网资讯 浏览 389 09-11

宝妈在朋友圈卖减肥咖啡1年赚6万元 结果被判10年

重案组37号 浏览 237 09-17

美军遭遇重大伤亡,中东或将开启全面战争

浏览 8252 07-14

宝利德破产听证后官司缠身 昔日豪车经销商驶向何方

财闻 浏览 39 11-17

夫妻工地干活时女儿从13楼坠亡索赔89万 法院判了

极目新闻 浏览 1657 08-09

海辰储能澄清“与印度信实公司技术合作”:不实谣言

中新经纬 浏览 130 09-26

OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作

量子位 浏览 115 10-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11