参考指南

打开字节、阿里们的多模态能力地图，每块宝藏都标着"语音”。

近期，就在阿里通义千问团队发布翻译模型Qwen-MT的同一天，字节跳动旗下的火山引擎正式对外发布了豆包·同声传译模型 Seed LiveInterpret 2.0，后者的模型在多个Benchmark测试中都获得了大幅度领先，但其实该模型的首版发布已经是去年的事了。

时隔一年，字节再次将这个模型端出来，并花大力气更新换代了一次，字节想做什么？

我们可以把时间线串联起来看：字节豆包团队于 2024 年推出了旗舰语音生成基础模型 Seed-TTS，今年1月发布了豆包 Realtime Voice Model（首个端到端语音理解与生成模型），4月开源了中英双语TTS模型MegaTTS3，1个月前则发布了豆包播客语音模型。

作为豆包多模态能力中的重要一环，字节将同声传译补足到了语音能力之中。反观阿里，去年也曾高调推出了新一代端到端语音翻译大模型 Gummy，这回在翻译能力上又进一步。如果将视野再打开，环

豆包上新同声传译，顺便狙击阿里AI眼镜？

陈东征病逝：...

起拍价3.9...

管涛：百年美...

县委原书记被...

谁赢？阿卡&...

言短意长｜澎...

网红＂迅猛龙＂223分上岸复旦：每天学10小时天天哭

挺全面！7号秀费尔斯30分钟15中8贡献22分6板6助罚球8中5

老百姓理想的“L6” 从13.49万降到7.99万

卡萨诺：阿莱格里跟魔笛会相处融洽，尽管他当初弃用过皮尔洛

男孩多年前跪继父坟前痛哭如今央视前主持人全网寻人

长川科技“钞能力”不好使了？

王毅同印度外长会谈：双方应择高处立实现＂龙象共舞＂

不给杨瀚森传球，他有自己的理由

股民们！你知道，今年券商有多赚钱吗

韩国总统办公室回应朝方表态：将继续为实现和平而努力

打破垄断，半导体独角兽，片仔癀的替身！

这些食物不宜食用，守护健康需谨慎

内容创作者，别漂了来上海！“沪九条”给资源、给场景、还给“职称”

韩飞行员协会驳斥济州航空空难调查：“甩锅”飞行员

【WAIC2025】AI教父杰弗里·辛顿：避免“养虎为患”，要训练“善良”的AI

量子计算优秀成果案例发布第四届CCF量子计算大会在成都开幕

海航集团原美籍高管、首席执行官获刑6年详情披露

马斯克发起投票询问＂现在是否是创建新政党的时候了＂

中美博弈的本质：实体和虚拟经济的决战

口腔溃疡老不好，是癌变信号吗？

小米雷军营销翻车？纸巾盒是车规级，车机芯片却是消费级

小米YU7：以“科技平权”之名，能否撼动Model Y的霸主地位？

合资车企雨过天晴？多家5月销量回暖

“成都造”游戏《明末：渊虚之羽》发售首日：登顶Steam全球热销榜