简介:摘要:近年来,随着人工智能与大数据的发展,AI生成图像技术已经得到了质的飞跃。本论文在此基础上提出了一种新颖的视频生成模型,特别是尝试从文本描述中处理视频生成问题,即合成以给定文本为条件的逼真的视频。由于帧不连续性的问题和无文本的生成方案,现有的视频生成方法无法轻松地很好地处理此任务。为了解决这些问题,文章中提出了一种循环反卷积生成对抗网络(recurrent deconvolutional generative adversarial network RD-GAN)[2],其中包括一个循环反卷积网络( recurrent deconvolutional network RDN)作为生成器和一个3D卷积神经网络 (3D convolutional neural network 3D-CNN)作为鉴别器。RDN是循环神经网络RNN的反卷积版本,可以很好地对生成的视频帧的长时间依赖性进行建模,并充分利用条件信息,生成更多高质量的连续帧。