关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013522人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这一次,新剧惨遭抵制的黄奕,终是付出了代价?

白面书誏 浏览 470 08-21

26款岚图梦想家谍照曝光 开启MPV智能超混新时代

网易汽车 浏览 470 08-16

高现金分红之外 三大电信运营商打造“第二增长曲线”

证券市场周刊 浏览 421 09-02

给面!亚马尔:世界杯的对手都很难踢,如果决赛踢中国队也很难踢

直播吧 浏览 1247 07-15

“复制”袁隆平,或是预报传染病?战略科学家畅享科学智能

上观新闻 浏览 4157 07-27

限量50台 迈凯伦750S勒芒特别版官图发布

车质网 浏览 448 06-04

乌代表团赴美谈判 俄乌互相袭击

新华社 浏览 241 12-01

罗永浩“熬面”,拯救方便面的“中年危机”?

伯虎财经 浏览 434 09-01

注册资本200亿 新央企中国长安汽车集团成立

界面新闻 浏览 6215 07-29

李佳航、印小天拍短剧?还是穿越题材

最爱酷影视 浏览 311 10-12

上海市中心一加油站被质疑有爆炸风险 多方回应

上观新闻 浏览 6707 07-23

鸿蒙智行享界品牌标识纪念品 7 月 30 日起将分批发放给车主

IT之家 浏览 5385 07-27

爱康国宾,越描越黑

斑马消费 浏览 3485 07-31

秋季穿衣原来如此简单!记住这几组穿搭公式,得体简约又耐看

静儿时尚达人 浏览 259 11-01

媒体:泰军缴获柬军中国制造反坦克导弹 有人阴阳怪气

新民周刊 浏览 229 12-19

3月5日将上市 比亚迪海豹07EV有望搭载闪充技术

网易汽车 浏览 152 03-03

泽连斯基被疑"诅咒特朗普":政客嘛 早晚会死

澎湃新闻 浏览 219 12-21

重磅!东莞银行(国际)正式开业,系首家在港设立子行的城商行

湘财Plus 浏览 459 08-12

“这件衣服”今年春天爆火!时髦的人都在穿

LinkFashion 浏览 154 03-07

对话王兴兴:机器人给国家交税不是梦!

态℃ 浏览 6127 08-10

古二3次发布录音,王家卫秦雯深陷争议

阿伧说事 浏览 250 11-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11