关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2025-10-28 00:00:0179人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

最好看的羽绒服,都满足这几点

Yuki女人故事 浏览 20 12-05

拼多多“千亿扶持”落地半年,“包邮区”持续扩大,更多地区享受便利网购服务

雷峰网 浏览 42 11-17

很轻松!队记:杨瀚森看起来玩得很开心 一直带着微笑

直播吧 浏览 8538 07-12

泰国出动4架战机空袭柬埔寨 还在柬沿海部署8艘军舰

每日经济新闻 浏览 10339 07-27

前员工网站发文称华熙生物财务造假等,公司回应:内容严重不实,已经报案

红星资本局 浏览 3109 07-27

等你过了五十岁,千万别穿的花花绿绿,这才是高级感的打开方式

静儿时尚达人 浏览 8237 07-09

伊姐周六热推:电视剧《彼岸灯塔》;电视剧《潜渊》......

伊周潮流 浏览 4064 06-15

媒体:高市早苗疯言台湾问题 中方对她没什么好客气的

新民晚报 浏览 57 11-10

英国智库:就算美国报复 英国也不能和中国断联

澎湃新闻 浏览 7282 07-09

阿里Wan2.2-S2V正式发布:一张图+一段音频 即可生成人物动态视频

快科技 浏览 247 08-27

83岁韩议员访华观礼:都怪尹锡悦乱来 让我们落后中国

澎湃新闻 浏览 276 09-07

西安将全面暂停网约车“一口价”“特惠单” 官方回应:属实,正督促平台落实

看看新闻Knews 浏览 266 08-20

巴菲特被曝已清仓比亚迪,持股期间比亚迪股价涨超38倍

澎湃新闻 浏览 188 09-22

老人骑电动车被撞后身亡 司机上诉:96.8公斤属机动车

红星新闻 浏览 5697 08-13

李兰迪元气透亮肌的权威,我后知后觉

时尚COSMO 浏览 5604 07-30

模仿学习新范式,Chain-of-Action:轨迹自回归实现动作推理

机器之心Pro 浏览 2518 07-16

中国移动成出海“赋能者”,聚星计划覆盖5000+伙伴

雷科技 浏览 100 10-21

俄媒:俄罗斯一客机因出现技术故障返航

环球网资讯 浏览 9309 06-30

王欣瑜补赛速胜进四强,退赛蒙特利尔被猜测为冲击布拉格冠军

网球之家 浏览 6176 07-26

iQOO Z10 Turbo Pro 手机获 UFCS 认证

IT之家 浏览 2111 07-16

中国对日本政府发出第一道制裁令 暗示了高市早苗结局

时时有聊 浏览 23 12-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11