关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:013324人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深夜!闪崩,暴跌!

券商中国 浏览 4370 07-17

双子座流星雨即将引爆冬日夜空,成都“观星+”消费持续升温

红星新闻 浏览 16 12-12

以军两个方向朝加沙城市中心推进

环球网资讯 浏览 173 09-20

荣耀 Magic7 系列手机获 MagicOS 9.0.0.182 升级

IT之家 浏览 2032 07-18

鹿晗账号解禁后首晒自拍,涨粉超400万

大象新闻 浏览 5363 07-13

史上首次!微软官宣Windows 26H1版本:已推出测试版

快科技 浏览 55 11-10

罗志恒:反内卷与供给侧改革有何不同?

首席经济学家论坛 浏览 248 09-02

突发!56岁博导董事长被留置,此前董秘已被立案

深蓝财经 浏览 2876 07-24

不管在什么地方 你都是那样拉轰的男人

星球商业评论 浏览 87 11-01

法国空军称"阵风"战机演习中"击落"美F-35A 专家解读

都市快报橙柿互动 浏览 271 09-08

古驰上半年收入大跌26%,奢侈品巨头也不好过了?

江瀚视野 浏览 9342 08-07

谢霆锋徒弟横空出世!《捕风追影》5分钟惊艳演出,港娱后继有人

温柔娱公子 浏览 240 09-02

锻造企业“系统韧性”,九牧重构全球卫浴产业新生态

智谷趋势 浏览 2917 07-18

郑智化发声道歉!坦言自己情绪上头用词不当

萌神木木 浏览 93 10-28

最低40万元一套 李嘉诚家族甩货大湾区400套房源

每日经济新闻 浏览 10365 07-31

预测票房26亿!除了中文配音拉胯,《疯狂动物城2》没任何毛病

最爱酷影视 浏览 28 11-27

多国领导人祝贺中国 普京:俄中关系达历史最高水平

三湘都市报 浏览 193 10-02

英媒:纽卡已将伊萨克踢出合练,埃迪豪当面告知了球员这一决定

直播吧 浏览 2623 08-07

陆毅自曝恋爱细节,贝儿吃惊地张大下巴

疯说时尚 浏览 8397 08-10

茅台集团:坚决拥护中央和省委有关部署

界面新闻 浏览 2807 06-12

三电机四驱版17.99万元 2025款山海T1上市

网易汽车 浏览 251 05-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11