基于gan的文本图像生成技术【字数:14917】
目录
摘 要 III
关键词 III
ABSTRACT IV
KEY WORDS IV
1 引言 1
2 文献综述 1
3. 方案论证 3
3.1 生成对抗网络 3
3.2 基于GAN的文本图像生成模型 3
3.3 项目总体方案 5
4 设计论述 5
4.1 预训练阶段 6
4.1.1 文本编码器 6
4.1.2 图像编码器 7
4.1.3 Word loss 7
4.1.4 Sentence loss 8
4.2 基于注意力机制的多阶段生成模型 9
4.2.1 低分辨率生成阶段 10
4.2.2 融合注意力机制的高分辨率图像生成 11
5 实验与结果分析 13
5.1 数据集及数据预处理 13
5.2 实验过程 14
5.3 实验对比及结果分析 15
5.3.1 使用Inception score衡量 15
5.3.2 视觉评价 15
5.4 对注意力机制的分析 17
6 文本图像生成系统设计与实现 20
6.1 需求分析 20
6.2 系统实现 20
6.3 系统展示 21
7 总结与展望 22
7.1 总结 22
7.2 展望 23
参考文献 23
致谢 24
基于GAN的文本图像生成技术
摘 要
近年来,以生成对抗网络(GAN)为核心的文本图像生成技术迅速发展。这一技术旨在从自然语言文本描述中自动生成对应的图像,有着大量潜在应用。由于涉及图像处理和自然语言处理两大领域,文本图像生成属于跨模态的问题,这给很多问题增加了难度,比如相似性的度量和损失函数的设计。目前主要的难题在于图像的真实性和语义的一致性。本文主要关注生成图像真实性的问题。具体来说,本文使用全局注意力机制和多阶段生成方法,将生成高分辨率图像问题分解为若干个小 *51今日免费论文网|www.51jrft.com +Q: ^351916072#
问题,同时引入了全局注意力机制,使得生成网络对于文本的不同位置赋予不同的注意力权重,以此提升生成图像的细节信息。在损失函数上,本文也做了一些改进,增加了基于注意力机制的文本图像匹配损失项。在实验上,本文设置两组对比实验来研究注意力以及网络深度对生成图像效果的影响,并分别从数量和视觉感官两个角度进行衡量。此外,本文通过可视化注意力矩阵,对注意力机制进行了分析。实验表明结合注意力机制的多阶段生成模型在CUB2011鸟类数据集上得到较好的效果。在上述算法基础上,本文使用Flask框架实现了基于web的文本图像生成系统,展示算法效果。
目录
目录
原文链接:http://www.jxszl.com/jsj/wljs/606885.html


