
当我们问Siri今天天气如何时,它能轻松给出答案。但如果你问它明天股市会涨还是跌,或者下周的体育比赛谁会获胜,它就束手无策了。这正是人工智能面临的一个巨大挑战:如何在真实世界中进行准确的未来预测?
这项突破性研究由ByteDance Seed、复旦大学、斯坦福大学和普林斯顿大学的研究团队共同完成,于2025年9月发表在arXiv平台上(论文编号:arXiv:2508.11987v3)。感兴趣的读者可以通过https://futurex-ai.github.io/获取完整的研究资料和最新进展。
要理解这项研究的意义,不妨把当前的AI模型比作一位博学的图书馆管理员。这位管理员熟知图书馆里的每一本书,能够回答关于历史、科学、文学等各种已知知识的问题。然而,当你询问明天会发生什么事情时,这位管理员就显得力不从心了,因为图书馆里的书籍都记录的是过去的事情。
正是基于这样的观察,研究团队开发了FutureX——这是世界上第一个专门测试AI模型未来预测能力的实时评估平台。可以把FutureX想象成一个永不停歇的智力竞赛节目,每天都会出现新的预测题目,而参赛选手就是各种最先进的AI模
 
                                     
                                     
                                     
                                     
                                     
                                     
             
                         
                         
                         
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
            