智东西
编译 程茜
编辑 李水青
智东西8月6日消息,昨夜,谷歌DeepMind宣布推出通用世界模型Genie 3,首个可实时交互世界模型来了。
基于文本提示,Genie 3可以允许用户以每秒24帧的速度,以720p的分辨率生成长达数分钟的交互式3D环境,Genie 2仅能生成10到20秒。
去年年底,谷歌DeepMind发布能生成各种可控制动作、可玩3D环境的大型基础世界模型Genie 2,此次发布的Genie 3,是其第一个允许实时交互的世界模型,在一致性和真实感方面相较前代有提升。如下面的示例中,Genie 3生成内容的机器人本体、