
这项由ServiceNow公司的Nima Sheikholeslami领导的研究团队完成的突破性工作,发表于2025年9月30日的arXiv预印本平台(论文编号:arXiv:2510.00137v1)。感兴趣的读者可以通过该编号查询完整论文。这项研究揭开了当前AI检索系统的一个重大缺陷,并提出了一种全新的训练方法,让搜索引擎能够给出更可靠、更一致的相关性评分。
在日常使用搜索引擎或问答系统时,你是否遇到过这样的困扰:明明搜索的是同一个问题,但系统给出的答案质量却忽高忽低,有时候不相关的内容反而排在前面?这个问题的根源其实隐藏在AI检索系统的核心训练机制中。目前主流的检索系统就像一个只会相对比较的评委,它能判断在同一个问题下哪个答案更好,但无法给出绝对的好坏评分。这就导致了一个尴尬的局面:对于不同问题的答案,系统无法进行跨问题的质量比较。
ServiceNow的研究团队发现,这个问题源于目前广泛使用的对比学习方法。这种方法就像让学生只做选择题,永远不做绝对评分题。学生虽然能在给定选项中选出最好的答案,但无法给每个答案一个独立的分数。更严重的是,研究团队通过严格的数学证明发现,现有的训练方法在提升检索质量这个核心
 
                                     
                                     
                                     
                                     
                                     
                                     
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
            