关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013320人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

釜山电影节红毯来了!孙艺珍一身粉裙像睡衣,Lisa礼服又透又贴身

萌神木木 浏览 185 09-18

“男人的衣柜”跨界卖水?

诗与星空 浏览 14 12-11

请师傅吃饭碰杯,李想的“刘强东式”公关能否奏效?

三言科技 浏览 277 08-19

时隔17年,河内公安外援乌戈-戈麦斯晒与塞尔吉尼奥合影

懂球帝 浏览 168 09-21

德媒:特朗普近期至少4次致电莫迪均被拒

环球网资讯 浏览 289 08-27

都不装了:美媒称特朗普放话轰炸莫斯科 普京拒绝谈判

博览历史 浏览 3286 07-11

何猷君为6岁儿子何广燊庆生,儿子神似赌王

王稱吃吃喝喝 浏览 83 10-26

2025前沿科学创新大会发布“人类面临的前100大挑战”全球问题征集

环球网资讯 浏览 6726 07-13

印度一对父母为参加女儿毕业典礼 改签飞机不幸遇难

潇湘晨报 浏览 1328 06-15

电车购置税补贴减半在即,这场兜底之战谁敢不打?

汽车公社 浏览 82 10-29

赫罗纳3-3皇家奥维耶多,比尼亚斯破僵,戴维-卡尔莫扳平比分

懂球帝 浏览 83 10-26

意大利球员转会费top10:雷特吉居首,布冯第四维埃里第五

直播吧 浏览 5393 07-22

俄官宣“末日鱼雷”完成核动力试验

环球网资讯 浏览 77 10-31

胡塞开始清理红海 外国船挂五星红旗“蹭保护”

掌青说历史 浏览 6908 07-10

半两财经|首款eSIM手机发售 国内运营商加速“无卡化”

北青网-北京青年报 浏览 102 10-23

湖南东江湖白廊景区一游船侧翻致29人落水 已救出28人

央视新闻客户端 浏览 7947 07-06

机器人变身售货员!天府绛溪实验室这一临时“训练场”正式启用

红星新闻 浏览 8591 08-07

中美贸易“不平衡”是个伪命题

浏览 9673 08-20

致敬球队传奇,多特官方商城为球迷免费印11号罗伊斯

懂球帝 浏览 14 12-11

宗馥莉被起诉,富二代们坐不住了?

恪守原则和底线 浏览 8256 07-20

领益智造新能源汽车及AI产业集群项目签约落户苏州相城

证券时报 浏览 220 08-19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11