
在人工智能绘画的世界里,一直有个让研究者头疼的问题:如何让AI更好地理解我们的文字指令,画出我们真正想要的图片?比如我们说"一只黑猫坐在红椅子上",AI有时候会画出白猫、蓝椅子,或者猫站着而不是坐着。为了解决这个问题,科学家们一直在寻找更好的"训练方法"。
这篇由英属哥伦比亚大学的程嘉俊和李木晨,以及快手科技凌团队的杨皓天、陶欣、万鹏飞等研究者共同完成的论文,发表于2025年9月,为我们带来了一个令人惊喜的解决方案。他们提出了一种全新的"文本偏好优化"方法,能够让AI绘画模型在不需要任何人工标注图片偏好的情况下,就能学会更准确地理解和执行我们的绘画指令。这项研究的代码已经在GitHub平台开源,标识为DSL-Lab/T2I-Free-Lunch-Alignment,让更多研究者能够使用和改进这项技术。
要理解这项研究的重要性,我们需要先了解AI绘画模型是如何工作的。就像教一个孩子画画一样,传统的方法需要大人不断地告诉孩子"这张画好"、"那张画不好",通过这种反馈来让孩子学会什么是好的绘画。在AI的世界里,这种反馈叫做"人类反馈强化学习",需要大量的人工标注员来比较不同图片的好坏,告诉AI哪张图更符合要求。但这
 
                                     
                                     
                                     
                                     
                                     
                                     
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
            