新京报贝壳财经讯(记者罗亦丹)记者9月10日获悉,“清华系”AI公司生数科技旗下视频大模型Vidu正式推出Vidu Q1参考生图功能,以支持7张参考图输入打破国内生成上限,并在一致性、还原度等关键指标上正面对标最近爆火的Nano Banana。
生数科技方面表示,从单图参考到多图参考,是AI生图在一致性上的不断突破,“可以说没有一致性,就没有大规模商业化应用。”不同于单图参考的单一限定条件,Vidu Q1参考生图可以指定人物、场景、道具进行自由创作,通过多个参考对象实现对画面的更强可控。
如下图的“让莱昂纳多坐在霍格沃茨学院的教室里练习魔法。”输入的多张参考图中包含了人物、道具、服饰、配饰等多个主体,场景非常复杂。

从输出的结果来看,Vidu Q1参考生图严格遵循提示词,人物发型、五官均保持与原图一致,每个
 
                                     
                                     
                                     
                                     
                                     
                                     
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
            