关闭广告

MIT和斯坦福打造"超级听力"AI:让机器像人耳一样理解声音的奥秘

科技行者2025-08-27 00:00:01431人阅读


这项由MIT脑与认知科学系的Greta Tuckute以及斯坦福大学计算机科学系的Klemen Kotar、Daniel L. K. Yamins等研究者共同完成的突破性研究,发表于2025年8月的arXiv预印本平台。有兴趣深入了解的读者可以通过arXiv:2508.11598v1访问完整论文。

说起人类的听觉系统,那真是一个令人惊叹的生物工程奇迹。我们能够在嘈杂的咖啡厅里轻松分辨出朋友的声音,能够从语调中听出说话人的情绪变化,甚至能够在听到一个陌生单词时大致猜出它的含义。然而,让人工智能系统达到人类这样的听觉理解能力,却是一个让科学家们头疼了很久的难题。

传统的AI语音处理系统就像是一个只会机械记忆的学生,它们要么专注于完美地复制原始音频信号的每一个细节,要么依赖复杂的对比学习机制来区分不同的声音片段。这些方法虽然在某些特定任务上表现不错,但却缺乏人类

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

三亚网红跳水点被指装满防盗刺 官方:早就不允许去了

上游新闻 浏览 475 09-19

长安汽车董事长朱华荣:预计到 2030 年,L2 辅助驾驶将成为标配

IT之家 浏览 304 10-17

法总理体验阵风战机被卡住 工程人员紧急“营救”

扬子晚报 浏览 4055 06-21

希金斯晋级斯诺克北爱赛八强

体坛周报 浏览 284 10-24

K联赛外援进球后跑去上厕所!韩媒计时:用时27秒09后他回到场内

直播吧 浏览 1226 07-22

尹锡悦牢房仅6.6平米系历任中最小 已换上卡其色囚服

扬子晚报 浏览 1741 07-11

响应“人工智能+”国家行动,方舟健客(06086)“杏捷大模型”通过国家备案,为AI+慢病管理注入新动能

智通财经 浏览 306 11-03

上海机场可暂存充电宝7天 网友:存取不便 要走3公里

新京报 浏览 3098 07-03

前曼城助教:08年曼城曾为梅西报价3000万镑,这惹怒了巴萨

懂球帝 浏览 247 12-16

队史最佳阵容之凯尔特人篇 塔图姆和布朗能入选否?

仰卧撑FTUer 浏览 2733 08-10

千亿兴银基金“空降”董事长!

独角金融 浏览 436 09-02

中戏否认闫学晶儿子读新疆班,曾参加全国统一考试,网传消息不实

扒虾侃娱 浏览 229 01-12

男子花3万请网红带货:下599单仅成交4单收入700元

环球网资讯 浏览 234 01-09

Here we go!罗马诺:佛罗伦萨边锋布雷卡洛将加盟奥维耶多

懂球帝 浏览 487 08-21

路虎揽胜电动版将于7月亮相!性能媲美V8版本

汽车网评 浏览 10091 06-30

蔚来ES8上市,李斌称若产能不足将补贴明年购置税退坡部分

贝壳财经 浏览 343 09-21

美抓捕非法移民引发冲突

浏览 9415 08-20

黄杨钿甜事件通报!耳环是假货父亲两项违规,母亲受访称好友相送

萌神木木 浏览 2664 07-17

夏天穿衣千万别太随意!上衣修身、搭配和谐,舒适得体又耐看

静儿时尚达人 浏览 500 08-11

镁信健康将亮相第八届进博会,发布三大产业级AI应用方案|进距离

上观新闻 浏览 236 11-01

日本间谍丑闻曝光:白俄罗斯电视直播揭露!

浏览 1116 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11