关闭广告

阿里端出最强语音模型!英文rap精准转文字,准确率干翻全球

智东西2025-09-09 12:00:01166人阅读


▲头图由AI生成

智东西
作者 程茜
编辑 心缘

智东西9月9日报道,昨天,阿里发布最新语音识别模型Qwen3-ASR-Flash,该模型基于Qwen3基座模型训练,支持11种语言和多种口音。用户可以通过ModelScope、HuggingFace和阿里云百炼API Qwen3-ASR-Flash免费体验。

在ASR(自动语音识别)的多项基准测试中,Qwen3-ASR-Flash在方言、多语种、关键信息识别、歌词等方面的识别错误率明显低于谷歌Gemini-2.5-Pro、OpenAI GPT-4o-Transcribe、阿里巴巴语音实验室Paraformer-v1、字节豆包Doubao-ASR

具体来看,该模型支持中文、英语、法语、德语等11个语种,识别过程中能自动分辨语音语种、自动过滤静音和背景

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

6旬董事长直播间跳舞20万人围观 女儿接班7年巨亏32亿

极目新闻 浏览 231 09-10

蔡依林被拍「9点半还没到家」!现身澳门原因曝

ETtoday星光云 浏览 256 08-26

多项人工智能赋能基础教育代表性成果在京发布

环球网资讯 浏览 845 07-14

长安深蓝 S05 汽车将推 620km 超长续航版本

IT之家 浏览 2281 07-25

记者拨通失联高考生电话 对方自称缅甸人:朋友给的卡

极目新闻 浏览 794 07-17

美职联季后赛东部对阵:迈阿密国际VS纳什维尔,赛制三局两胜

懂球帝 浏览 96 10-19

斯卢茨基:最后时刻丢球难以接受,争冠主动权已不在我们手中

懂球帝 浏览 167 09-22

Here we go!罗马诺:迈阿密国际20岁中场克雷马斯基租借帕尔马

直播吧 浏览 174 09-01

全球AI云竞赛,阿里靠什么打?

虎嗅APP 浏览 162 09-21

邮报:曼联教练组已要求弗莱彻增强体能,为一线队首秀做准备

懂球帝 浏览 4792 08-14

熊园:“十五五”大方向已定,如何跟踪?

首席经济学家论坛 浏览 91 10-28

美国“接吻虫病”冲上热搜

网易健康 浏览 170 09-20

今年秋天穿小香风外套,配阔腿裤太好看了!

LinkFashion 浏览 105 10-15

友邦保险受益港险热,但泰国动荡亏了7.5亿美元

达摩财经 浏览 265 08-23

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 131 09-26

退600万应援,朱一龙用120亿票房证明,顶流可以不“营业”

娱乐白名单 浏览 255 08-18

吴京因为说坦克是没有后视镜遭人恶评

七公子娱乐 浏览 251 08-27

2025秋冬大衣流行趋势

LinkFashion 浏览 94 10-23

记者手记:一场中欧科学家关于创新的“双向奔赴”

新华社 浏览 5735 07-26

“Go Global”战略里程碑进展!远大医药钇[90Y]欧洲新增适应症获批

环球网资讯 浏览 211 09-09

量子版“梵高名画”,量子流体中首次观测到新型涡旋结构

IT之家 浏览 307 08-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11