关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013526人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

横滨冠军赛女单1/4决赛:石洵瑶4-0战胜蒯曼,晋级四强

懂球帝 浏览 6289 08-11

上任即取大胜,新疆主帅格兰:这不是我的功劳,是球员打得好

懂球帝 浏览 210 01-12

智己LS9申报图曝光 或将于四季度正式上市

车质网 浏览 4116 07-17

普通人秋天就该这么穿,准备几件黑色单品和牛仔服饰,简约又百搭

静儿时尚达人 浏览 307 10-23

更换人工髋关节,拉梅拉:希望这能让我过上无疼痛的生活

懂球帝 浏览 59 04-29

上海海事局:长江口10日一大型船舶航行交通管制

中华人民共和国海事局 浏览 409 09-09

年内暴涨540%!比存储芯片更猛的大牛股爆了

财经锐眼 浏览 44 05-09

男子组织多名未成年失足女飞多地卖淫 让女友发避孕套

红星新闻 浏览 441 09-20

国民党"内讧"郑丽文开会不邀卢秀燕 党内炸锅大佬现身

博览历史 浏览 222 01-05

鱼死网破!赵露思直播“解约”

说历史的老牢 浏览 2081 08-05

分手传闻才3个月,关晓彤又有喜讯,原来鹿晗早就“高攀不起”她

老吴教育课堂 浏览 3034 07-16

不为少数人闪耀,零跑这十年为什么只做经典款?

智谷趋势 浏览 2130 07-15

字节跳动OmniHuman:静态照片秒变生动视频

科技行者 浏览 458 08-27

投资3万年入百万?起底“假冒支付宝招商”骗局:多地商户上当,涉案金额超千万

蓝鲸新闻 浏览 4070 08-10

大连一航班因旅客突发疾病返航 乘客:等了约一小时后复飞

极目新闻 浏览 3215 07-10

财报“难产” 天茂集团沉浮录

铑财 浏览 7430 07-14

举报违规最高奖励100万,证监会“吹哨人”保护计划深度揭秘

21世纪经济报道 浏览 297 10-02

滴滴跑出了什么新故事?

虎嗅APP 浏览 425 09-01

意媒:阿斯拉尼仍未被说服加盟博洛尼亚,跟金钱无关而是有关信心

直播吧 浏览 475 08-21

新规在路上!基金销售要“变天”?

国际金融报 浏览 222 12-19

争夺女性用户,李想抢不过雷军

字母榜 浏览 314 10-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11