关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2026-01-13 00:00:01229人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

辛巴退播难平众怒!打假博主内涵其装病,此前已五次宣布退播

萌神木木 浏览 517 08-19

力鸿一号未来技术成熟后,可提供亚轨道太空旅游服务

IT之家 浏览 231 01-13

由于成都蓉城输球,德尔加多足协杯停赛将转移到联赛

懂球帝 浏览 441 08-20

越疆科技首席科学家郎需林:不比谁做得像人,比谁的机器人能更快走上岗位

红星资本局 浏览 6218 08-10

足球报:北京市体育局与足协相关领导都会现场观战足协杯决赛

懂球帝 浏览 216 12-02

马杜罗预计5日在纽约"首次出庭"

扬子晚报 浏览 218 01-05

RedPlay新阵地:小红书游戏行业峰会解码「种草用增」新思路

环球网资讯 浏览 200 02-02

500万闪电到账!浦发、中信、广发等五大商业银行联手破解中小微企业融资困局

杠杆游戏 浏览 486 08-21

内塔尼亚胡证实以色列打死伊朗情报部门负责人

央视新闻客户端 浏览 5458 06-17

不一定能掀桌男主,但一定是个好演员!

伊周潮流 浏览 227 01-24

选来选去还是这些穿搭最适合秋天,不老气、不死板,舒适大方

静儿时尚达人 浏览 227 11-06

原来他就是李雪健的儿子,不靠父亲靠自己

调侃国际观点 浏览 351 09-20

鸿蒙智行发布“性能车”预告图,对手锁定小米SU7!

汽车消费网 浏览 213 01-20

订单突破5万台/售12.98万起 长安启源Q07开启交付

网易汽车 浏览 485 05-22

副教授在小区被精神病人杀害 武汉警方辩称自身无责

红星新闻 浏览 493 08-20

中央批准 开除姜德果、唐德智党籍

北京日报客户端-长安街知事 浏览 176 03-03

美军参联会主席警告:对伊朗动武可能带来重大风险

央视新闻客户端 浏览 177 02-24

石油巨头裹足不前的心理阴影:委内瑞拉与美国的百年石油恩怨

澎湃新闻 浏览 243 01-12

美媒:美国曾以为贸易战能改变中国经济 但它错了

环球时报国际 浏览 244 11-06

多位行业人士接连警告"美债面临崩溃" 美财长回应

环球网资讯 浏览 10328 06-03

中国汽车智能化领跑

环球网资讯 浏览 3688 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11