关闭广告

豆包上新同声传译,顺便狙击阿里AI眼镜?

字母榜2025-07-28 00:00:023405人阅读



打开字节、阿里们的多模态能力地图,每块宝藏都标着"语音”。

近期,就在阿里通义千问团队发布翻译模型Qwen-MT的同一天,字节跳动旗下的火山引擎正式对外发布了豆包·同声传译模型 Seed LiveInterpret 2.0,后者的模型在多个Benchmark测试中都获得了大幅度领先,但其实该模型的首版发布已经是去年的事了。

时隔一年,字节再次将这个模型端出来,并花大力气更新换代了一次,字节想做什么?

我们可以把时间线串联起来看:字节豆包团队于 2024 年推出了旗舰语音生成基础模型 Seed-TTS,今年1月发布了豆包 Realtime Voice Model(首个端到端语音理解与生成模型),4月开源了中英双语TTS模型MegaTTS3,1个月前则发布了豆包播客语音模型。

作为豆包多模态能力中的重要一环,字节将同声传译补足到了语音能力之中。反观阿里,去年也曾高调推出了新一代端到端语音翻译大模型 Gummy,这回在翻译能力上又进一步。如果将视野再打开,环

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卡萨诺:阿莱格里跟魔笛会相处融洽,尽管他当初弃用过皮尔洛

直播吧 浏览 3842 07-16

男孩多年前跪继父坟前痛哭 如今央视前主持人全网寻人

极目新闻 浏览 3196 07-18

长川科技“钞能力”不好使了?

每日资本论 浏览 3443 07-28

王毅同印度外长会谈:双方应择高处立 实现"龙象共舞"

界面新闻 浏览 3040 07-15

不给杨瀚森传球,他有自己的理由

后厂村体工队 浏览 994 07-16

股民们!你知道,今年券商有多赚钱吗

说财猫 浏览 2061 07-17

韩国总统办公室回应朝方表态:将继续为实现和平而努力

界面新闻 浏览 1786 07-28

打破垄断,半导体独角兽,片仔癀的替身!

飞鲸投研 浏览 5442 07-28

这些食物不宜食用,守护健康需谨慎

浏览 2208 07-14

内容创作者,别漂了来上海!“沪九条”给资源、给场景、还给“职称”

上观新闻 浏览 609 07-16

韩飞行员协会驳斥济州航空空难调查:“甩锅”飞行员

极目新闻 浏览 9628 07-22

【WAIC2025】AI教父杰弗里·辛顿:避免“养虎为患”,要训练“善良”的AI

经济观察报 浏览 1702 07-27

量子计算优秀成果案例发布 第四届CCF量子计算大会在成都开幕

封面新闻 浏览 2234 07-22

海航集团原美籍高管、首席执行官获刑6年 详情披露

经济观察报 浏览 4204 07-23

马斯克发起投票 询问"现在是否是创建新政党的时候了"

环球网资讯 浏览 4359 06-06

中美博弈的本质:实体和虚拟经济的决战

睿知睿见 浏览 9167 07-13

口腔溃疡老不好,是癌变信号吗?

网易健康 浏览 1397 03-27

小米雷军营销翻车?纸巾盒是车规级,车机芯片却是消费级

象视汽车 浏览 9064 07-10

小米YU7:以“科技平权”之名,能否撼动Model Y的霸主地位?

车见万宜 浏览 7861 06-30

合资车企雨过天晴?多家5月销量回暖

禾颜阅车 浏览 1137 06-23

“成都造”游戏《明末:渊虚之羽》发售首日:登顶Steam全球热销榜

红星资本局 浏览 2336 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11