这些模型已经从 U-Net 架构发展到基于 Transformer 的架构,从而能够生成更逼真、时长更长的视频。 例如,Direct-a-Video 方法提供了基本的相机控制,MotionCtrl 和 CameraCtrl 则提供了更复杂的相机姿态操控。 在游戏领域,DIAMOND、GameNGen 和 PlayGen 等各种项目都尝试了特定 ...