"景先生毕设|www.jxszl.com

基于全卷积网络的农田遥感卫星图像语义分割【字数:9152】

2024-02-25 16:54编辑: www.jxszl.com景先生毕设
高分辨率遥感卫星图像的语义分割的研究热度一直很高,并且广泛应用于数字城市、道路提取、灾害评估等。本文利用全卷积网络(Fully Convolutional Network,FCN)进行可见光遥感卫星图像的语义分割处理,得到初步的地面分类效果。由于FCN分割效果轮廓粗糙,对轮廓细节特征不敏感,通过组合使用条件随机场(Conditional Random Field ,CRF)综合原始图像RGB颜色特征与空间位置关系,能够得到更加精细并且具有空间一致性的结果,进而优化分割效果。进行轮廓明显的分类对象结果优化,在总体上有积极的优化效果,将基于FCN8s的mIoU为50.3%提升到FCN+CRF的mIoU64.7%。关键字全卷积网络;条件随机场;语义分割;遥感卫星图像Semantic Segmentation of Farmland Remote Sensing Satellite Images Based on Full Convolution NetworkStudent majoring in computer science and technology Shi RuiTutor WU Yan-lianAbstractSemantic segmentation of high resolution remote sensing satellite images has always been a hot topic, and has been widely used in digital cities, road extraction, disaster assessment and so on. In this paper, the Fully Convolutional Network (FCN) is used to semantically segment the visible remote sensing satellite images, and the preliminary ground classification results are obtained. Because the FCN segmentation effect is rough and insensitive to the details of the contour, *景先生毕设|www.jxszl.com +Q: ^351916072
the combination of conditional Random Field (CRF) to synthesize the RGB color features and spatial position relationship of the original image can obtain more precise and spatial consistency results, and then optimize the segmentation effect. To optimize the result of classified objects with distinct outlines has a positive effect on the whole. The Miou based on FCN8s is 50.3% to 64.7% of the Miou based on FCN+CRF.1 绪论1.1 选题背景计算机视觉领域中,语义分割是将整张图像逐像素的进行分类,图像中每一个像素块都有语义可以解释的类别。随着人工智能技术研究的兴起与不断的发展,作为人工智能领域中至关重要的一个研究方向,语义分割的研究决定性地影响着人工智能的发展,而其本身也已经应用于各个领域。比如在汽车无人自动驾驶、汽车的智能驾驶研究方面,道路的边界、方向的识别,道路上的汽车、行人其它障碍物的识别;农业用于监控的无人机需要识别农作物及杂草,农作物的生长、病害情况;地理信息系统应用方面,通过对卫星图像语义分割处理后,用于地区的自然地理信息分类、道路的实际坐标提取等等。每当发生大型地质灾害需要进行灾害评估,地面飞行设备效率并不是很高,可以通过基于语义分割的卫星数据自动检测评估提高效率。针对用于中小区域范围的土地类型面积及占比统计的应用很少见到,所有本文利用FCN对某区域遥感卫星图像进行语义分割,然后统计计算农用土地信息,可以初步估计当地农用土地的面积及占比。同时可以迁移到其它地面类型信息获取,可以为发展中地区规划城区、工业园区等提供有效信息。遥感卫星图像中高光谱图、多光谱图等保存着更多的数据信息,但是其数据获取成本较高,甚至某些数据不是开放的。不过随着谷歌地图、百度地图等地图软件开始提供免费的高分辨率可见光卫星图像,高清级别可达到19级,对于普通卫星遥感图片土地分类研究已然足够,大量的高分辨率卫星图像数据获取已经不是难题。目前主流的图像语义分割方法是基于深度学习的分割方法,相比于传统的分割方法,无论是分割精度还是实用性都有着很大的提升。深度学习分割方法中最典型的是全卷积网络(Fully Convolutional Network,FCN),后续的大多数先进方法都是基于FCN实现,所有对FCN语义分割的研究学习也有助于深度学习分割方法的后续发展及学习。1.2 国内外研究引进深度学习之前,传统的语义分割的方法局限于具体的分割任务,根据图片的颜色、空间结构、纹理等统计特性区分不同的区域。传统的语义分割方法根据不同的分割策略可以大致分为基于阈值、局域、边缘以及结合特定理论[]的分割方法。但是传统分割方法仅仅运用颜色、纹理等这些统计特性,并且过度局限于具体的分割任务,没有多次迭代训练学习,在面对复杂的场景或者没有人为辅助过程的时候,传统的分割方法缺乏泛化性及实用性。随着深度学习的兴起、高速发展以及广泛的运用,深度学习开始在图像分割领域蓬勃发展,逐渐取代传统的分割方法,一系列基于不同神经网络训练的方法被提出,分割的精度也不断提高。2015年Long J[]等人提出全卷积网络(Fully Convolutional Network,FCN),可以适应不同尺寸大小的图像的输入,这一特点降低了网络计算的复杂程度,同时通过反卷积方式恢复原图像大小。FCN是根据卷积神经网络(Convolutional Neural Network,CNN)转变而来,在CNN的基础上将最后三个全连接层转化为卷积层,使得FCN网络结构中所有层都是卷积层。之后相继提出的先进分割方法基本是在FCN的基础上修改、优化或结合一些其它步骤实现。FCN的运用非常广泛,FCN被运用到很多领域,如宋青松[]等人将全卷积神经网络和条件随机场相结合的道路分割,使得分割边缘得到一定优化,分割的效果图拥有更多的轮廓细节。杨国亮[]将基于FCN地分割方法运用到医学图像分割,利用全卷积网络结合accard-Diceloss损失函数解决皮肤病变图像与背景区别过大的问题,经过试验表明,FCN结合accard-Diceloss损失函数医学方向向分割效果优秀,在医学图像分割应用前景较大。随着语义分割技术的发展,分割效果更加精确的技术相继被提出。针对FCN细节信息的部分丢失使得语义分割任务效果精确度不高,SegNet[]、U-Net[]等基于编码器-解码器结构的网络,通过解码器逐步恢复分割目标的细节信息。Liang-Chieh Chen等人提出的Deeplab[][]利用空洞卷积调整滤波器的感受野,解决了空间分辨率下降问题。1.3 应用前景1) 通过对高分辨率卫星图像的语义分割处理,可以快速计算各分类面积占比数据,从数据上直观地了解某地范围内的自然地理分布情况。提高实时获取地区资源、地区环境分布等统计数据的便捷及准确性。2) 在农业智能化方面,可利用语义分割农作物、农田区分进行农作物生长环境监控,农作物茎叶病害检测,农作物生长过程监控等等,基于像素级别的分割结果是农业智能化管理可靠的信息来源。3) 在道路驾驶导航应用方面,通过高分辨率城市卫星图像语义分割数据,获取道路准确的位置,可以大量减少人工获取道路位置工作量。同时在足够的服务器资源情况下,实时更新并处理高分辨率城市道路卫星图像,获取实时道路情况,给驾驶导航系统提供可靠道路信息以选取最佳导航路线。随着深度学习分割方法研究的发展,越来越多的自动化领域需要用到语义分割技术,任何智能管理系统正确的自我决策都基于准确的语义识别结果。更加准确、快速且实用性强的方法是研究的主要方向。FCN的出现,是全新的语义分割技术研究的开端,而未来的分割技术无论是基于FCN发展还是一种颠覆性的方法都会在分割精度、实用性等方面超过现有的技术。1.4 本文结构本文主要分六个部分,第一个部分为绪论,介绍了选题的背景、国内外研究的情况、应用前景分析以及文章的组织框架。第二部分主要介绍全卷积网络(FCN)结构、条件随机场算法原理以及开发平台信息。第三部分介绍基于全卷积网络的遥感卫星图像语义分割的具体实现,分别对自定义数据集和开源数据集(同为卫星图像数据集)进行网络训练学习,比较分析结果。第四部分则是通过条件随机场算法(CRF)优化FCN输出的分割结果,比较不同数据集测试结果,然后整合两种数据集进行训练,分析比较仅基于FCN的分割测试结果与结合CRF的分割测试结果。第五部分总结与展望,分析总结实现过程中的不足之处,提出未来可行的研究方向。2 分割算法介绍2.1 全卷积网络FCN对于图像分类、目标检测等简单标签识别任务,卷积神经网络已经有了突出的效果,但是简单的标签识别结果对于某些高精度领域还是不够的,需要针对数据图像每一个像素点进行分类。常见的卷积神经网络一般是由卷积部分、池化部分及全连接部分构成,正因为全连接结构的存在,使得输出结果是一个一维数据,而输入数据图片是二维矩阵数据,使得输出结果丢失了像素的空间位置信息[]。2015年提出了全卷积网络(Fully Convolutional Network,FCN),保留CNN的卷积、池化部分,将全连接部分转化为卷积层,故而称为全卷积网络。如图1所示,FCN利用卷积层代替全连接层,在最后一个卷积层输出的结果进行上采样,使输出结果恢复到数据图片输入时的尺寸大小,完成了对每个像素进行分类,同时也保留每个像素的位置信息。 在网络前五部分都有池化过程,每一次池化数据矩阵减小为原来的二分之一,最后一次池化得到的数据矩阵已经丢失了大量细节特征(局部特征),上采样得到的特征图特别粗糙。较浅层次的池化得到的特征保留着更多细节特征,将不同池化层得到的不同尺寸特征进行融合,以改善图像的分类结果。根据已有研究表明[],将第5层池化特征、第4层层池化特征和第3层池化特征融合得到8倍的上采样效果达到最好,再融合第2层池化特征或是减少特征,效果不再增加。如图2所示。图2 本文FCN跳跃结构示意图2.2 全连接条件随机场FCN的提出后,大量研究者开始注意基于FCN的像素级别的分类的实现。但是通过FCN分割得到的结果仍然比较模糊,特别是边缘部分分割粗糙。对于一张图像来说,像素与像素之间本身就存在相应的联系,图像中某个类别实体由若干个相邻的像素点构成,这些像素点在图像中形成一定的空间关系,但是FCN没有很好地处理像素之间的联系。使用全卷积网络得到像素级分类结果之后,再使用条件随机场综合图像的空间信息,能够得到更加精细并且具有空间一致性[]的结果。针对卫星图分割,使用条件随机场考虑原始输入图像的RGB颜色特征[]与空间位置关系,进一步改善像素级分割结果。对于一张原始图片中像素集合X={x1,x2,,xn},xi表示像素i的类别标签,都具有相对应的观测值yi,构成集合I={y1,y2,,yn},每个像素点作为节点,像素与像素间的关系作为边,即构成了一个条件随机场[](conditional random fields,CRF)。主要通过观测变量yi的值来推测像素i所对应的类别标签xi。条件随机场如图3图 3 条件随机场PXI=1????(????)exp (−????(????|????)) (1)公式(1)E(X|I)为能量函数,简化为E(X),EX=????????????(????????)+????建筑、水、森林、草地、荒地、背景7个类别,原视图像及标注图像如图4。/ /a原始图像 b标注图像图 4 a为原始图像 b为标注图像 3.1.2 本文标注数据集1)卫星图数据获取对比谷歌地图与百度地图两个软件提供的见光遥感卫星地图,百度地图所提供卫星地图为春夏季节时期,卫星图亮度相对较高,颜色较为饱和,各物体之间对比度相对高,易于区分,有助于深度学习有效特征提取。谷歌地图提供的卫星地图为秋冬季节时期,颜色较为暗沉,各物体之间对比度小,不易区分,故谷歌卫星图仅标注了44张作为初期搭建网络模型验证使用。通过百度地图获取南京市栖霞区某一部分区域可见光遥感卫星图,若干张张分辨率为1451*853卫星图,高清级别为19级,比例尺20m。标注完成后再进行分切得到300张分辨率为290*284大小的数据图片。该数据集根据DeepGlobe提供的开源数据集标签类别进行标注,标签包含农田、建筑、水、森林、草地、荒地、背景7个类别。2)数据标注标注工具labelme在anaconda3集成环境中安装并运行labelme程序,选择需要标注的原始图像,如图5选取需要标注实体轮廓,图6指定分类标签。标注完成后保存标注数据文件,labelme自动生成一个图7中所示json格式标签文件。/图 5 选取目标区域// 图 6 所选目标区域指定类别 图 7 labelme标注文件 通过labelme自带程序labelme_json_to_dataset.exe批量处理json文件,每个标注文件生成图8中相应的原图、16位的灰度标签图,打开标签图,可以明显看到图9不同类的灰度值不同。可以通过查看标签图灰度值检查不同灰度图同类标签灰度值是否对应。论文涉及到的不同分类对应灰度值如下背景0、水72、草地144、建筑228、农田248、荒地255。实际上所用到的标签图需要将灰度值控制在[0-class_num)之间,class_num为类别数,否侧训练的时候会出错,具体操作将在数据预处理部分介绍。/图 8 json生成文件/图 9 原图、标注图对比数据标注完成后,将大尺寸数据按不同比例分切,得到300张290*284数据,40张725*853数据,20张1451*853数据,分切过程保证原始图像与标签图像相互对应。将数据图片以递增数字重命名,通过系统抽样方式,以1结尾数据图片作为验证集,以5结尾的数据图片作为测试集。3.2 训练环境搭建本文模型训练分为两个阶段1) 笔记本电脑环境该环境主要为了实验搭建的FCN模型是否能够正常训练,在Windows 7系统环境下安装anaconda3集成环境,在anaconda3环境下安装TensorFlow1.5(兼容旧版CPU),然后TensorFlow环境下安装python3.5、Spyder3编译器。并以44张卫星地图数据集进行网络训练确定网络是否正常学习,是否能实现图像的语义分割。1) 完整数据集,服务器环境训练确认FCN网络结构可以正常进行训练之后,需要进行大量数据训练。由于笔记本实验环境条件差、训练速度非常缓慢,所有训练环境开始迁移到服务器环境。本文选用Google的云服务器,主要设备信息如下GPUTesla T4 显存13.78GiB 1.59GHzCPU2.2GHz内存14.73GiBubuntu18.04.1Python 3.6通过Google Drive关联Colaboratory,创建Colaboratory文件,设置类型为python3,加速模式为GPU,开始搭建环境。搭建好环境后,上传数据集、代码文件至Google Drive,在Colaboratory文件中关联文件路径,执行FCN主程序进行训练。3.3 FCN训练3.3.1 数据预处理 FCN支持任意尺寸的图片数据进行训练和预测,但是为了减少数据的运算量,本文搭建的FCN网络输入的数据图片固定为224*224分辨率,标签图片必须是8位1通道的224*224尺寸灰度图。由于数据集标签类别为7类,所以灰度值也要控制在0到7之间。文章所用的开源数据集的标签图为3通道RGB彩色图,所以需要将RGB图转化为灰度值图,然后建立不同类别RGB值对应不同高灰度值,高灰度值又对应低灰度值,逐像素降低灰度值,图10列出对比,表1给出数值对比。8位1通道灰度值图处理好之后,需要将所有图片调整大小为224*224,然后打乱数据顺序,根据batch_size大小将数据输入FCN。////图 10 原图、RGB、高对比灰度值、训练灰度值图对比表 1 标签图RGB-灰度值对应表类别RGB灰度值(高)灰度值(低)背景(0 ,0 ,0 )00水(0 ,0 ,255)721草地(255,0 ,255)1442林地(树木)(0 ,255,0 )2203建筑(0 ,255,255)2284农田(255,255,0 )2485荒地(255,255,255)25563.3.2 参数初始化 FCN基于VGG-16[][]实现,保留VGG16前5个卷积、池化部分,前4次池化为平均池化,第5个池化操作为最大池化,直接以VGG16网络参数初始化这部分网络参数,表2列出相应参数。表 2 网络参数1Conv1_1Conv1_2Conv2_1Conv2_2Conv3_1Conv3_2Conv3_3Conv4_1Conv4_2Conv4_3Conv5_1Conv5_2Conv5_3Pool1-Pool4Pool5Conv6Conv7Conv8卷积核3*364个S=1same3*3128个S=1same3*3256个S=1same3*3512个S=1Same3*3512个S=1same2*2S=2平均池化2*2S=2最大池化7*7S=14096个same1*1S=14096个1*17个表 3 网络参数2learning_rateBatch_sizekeep_probability(dropout)Class_num1e-4;1e-664;120.85;0.57表3中参数keep_probability是Dropout[](随机失活)的概率值参数,即有1-keep_probability的概率使神经元不传递信息。在深度学习的模型中,如果模型的参数太多,但是训练数据集又太少,模型训练过程中很容易产生过拟合的现象。在训练神经网络的过程中遇到过拟合的问题是很常见的,过拟合现象具体的表现指的是模型在训练集数据上损失函数逐渐减小,最终的损失函数也很低,训练集图片预测准确率较高;但是在验证集和测试数据上损失函数比较大,预测的准确率比较低,模型的泛化性比较弱。Dropout(随机失活)主要思想是根据概率使一部分神经元不工作,权值不变,使得网络训练过程中放弃一部分信息,能够很好解决过拟合现象,使网络更具稳定性。本文FCN结构如图11,输入224*224*3大小的图片,第一部分卷积的2个卷积层用64个3*3,步长为1的卷积核进行卷积,padding为same,输出结果为224*224*64,通过2*2,步长为2的池化后输出112*112*64的结果。然后进入第二部分2个卷积层,仍然是3*3,步长为1的卷积核,但个数为128个,卷积后输出112*112*128的结果,进行同样的池化后输出56*56*128的结果。第三部分4个卷积层,卷积核和池化与前面相同,卷积核个数为256个,输出结果28*28*256。第四部分3个卷积层,卷积核个数512,参数一致,相同池化操作后输出结果为14*14*512。第五部分3个卷积层,卷积核512个,形状与前面一致,前四次为平均池化,第五次为最大池化,输出结果7*7*512。 卷积代替全连接部分,通过4096个7*7的卷积核,padding为same进行卷积,得到7*7*4096的结果,然后进行4096个1*1的卷积核进行卷积,输出7*7*4096的结果,再进行class_num个1*1的卷积核进行卷积,得到7*7*class_num的结果,class_num为标签类别数,本文为7,即7*7*7的预测结果。图 11 本文FCN结构图 得到预测结果后,通过上采样[](Upsampling,可以看做反卷积Deconvolutional)得到32倍的上采样结果。FCN32s得到的预测图效果非常粗糙,FCN8s通过融合pool4输出结果后再融合pool3输出结果来改善预测效果。3.4 测试结果分析1) 基础数据训练FCN8s网络,开源数据集652数据作为训练集,80张数据作为验证集,81张作为测试集,学习率为1e-4,batch_size为64,dropout的参数取值为0.85,训练4000次后,选择第3500次训练参数进行测试。本文标注数据集,256张作为训练集,29张数据作为验证集,进行训练。通过实践得到的效果如图12所示。原始图像标注图像预测图像开源数据集///本文标注数据集///图 12 基础数据集测试效果通过测试图片结果很容易的看出效果并不好,所以这一阶段的数据没有必要进行精度计算比较,652张数据的训练集与256张数据的训练集显然太少。深度学习非常依赖大量有效的数据,数据量大小直接影响语义分割的效果,少量的数据非常容易发生过拟合。2) 增强数据进行训练数据增大数据量是时解决深度学习过拟合、效果不佳等问题最直接、最有效的方式。由于FCN逐个像素进行分类,旋转过后的图片像素空间位置改变,对于FCN来说是全新的数据。开源数据集数据尺寸为2448*2448,正方形形状,故将803张数据分别旋转90度、180度、270度后形成全新的2459张数据,经过系统抽样方式划分为1966张数据的训练集、248张数据的验证集、245张数据的测试集。本文标注的数据由于原始尺寸不是正方形,所有只进行180度旋转,形成578张数据训练集,70张数据验证集,40张测试集,划分方式仍然为系统抽样。在数据集方面,为了提高FCN性能,除了增加数据量之外,本文还对所有数据进行原始图像的亮度增强。由于获取的可见光遥感卫星图的亮度偏低,增强数据的亮度,可以提高数据集的质量。通过训练实验,本文标注数据集先以在batch_size大小为64,学习率为1e-4进行训练,如图13,训练2500次左右,train_loss在1.0上下波动,然后将学习率改为1e-6。接着训练24500次,train_loss趋于稳定,在一定范围内波动。通过验证集loss表现看出,训练后期网络逐渐过拟合,没有改善趋势,停止训练。/图 13 本文标注数据集train_loss/图 14 vail_loss从图14数据可以看出网络训练次数大于11000开始,网络开始趋于过拟合状态,故选用11000次训练参数进行测试。图15给出了一部分测试图像的分割效果,首行是输入的原始图像,第二行是分别对应的标注图像,最后一行是FCN输出的预测图。从结果图可以看出,FCN可以分割出大部分特征明显的整体位置,但是在分割对象的轮廓部分尤为粗糙,几乎没有没有分割出轮廓的细节。除此之外,FCN对于比较小的物体特征也不敏感,图中的一些道路分割不连续,效果不佳。总体的来说,数据增强之后,网络的分割效果提升了很多,对于稍大一点的分割对象准确率还是比较高,但是轮廓细节的处理还有很大的提升空间。/ / / / / // / / / / // / / / / /图 15 增强数据训练结果通过结果分析,标签图的质量及网络特性在以下方面影响分割效果1)FCN的反卷积过程丢失细节特征,导致某些小目标的错分类,大目标缺乏边缘特征,使得整个分割效果不佳。2)像素与像素之间本身存在联系,但是FCN对每个像素进行分类,没有很好的考虑像素间的关系。如果标签图存在大量空类,预测图会出现一些噪点,在分割精度上会受影响。4) 标签图中存在同一类别对象没有被标注,但是别识别出来,实际上是正确的分类,但是根据标签图计算准确度的时候是错误的分类。5) 训练集的图像视野适中,视野太大,几乎没有标注图的类别轮廓细节,视野太小,缺乏卫星图语义分割的适用性,对于视野较小、分类轮廓清晰的卫星图识别效果好。而卫星图的特点是视野大,若将图片分切为小视野进行,工作量会增大很多。4 基于CRF实现优化 本文使用的条件随机场(CRF)方法是通过直接优化FCN得到的粗糙预测图,根据RGB原始图像信息再进行一次逐像素分类。条件随机场通过像素与像素值间的联系,临近相似的像素应该被分为同个一类别,是一个对轮廓细节特征比较敏感的方法。针对FCN对边缘分割精确不高的问题,利用CRF作为后端优化FCN的结果。图16给出FCN预测结果与FCN+CRF预测结果对比,表4列出评价指标数值对比。/ / / / // / / / // / / / // / / / /图 16 增数据训练结果表 4 FCN与FCN+CRF准确率比较mIoUmpaFCN本文标注数据0.61920.7540开源数据0.50290.6712FCN+CRF本文标注数据0.64710.7838开源数据0.64690.8167通过实验结果观察,CRF对轮廓明显的分类目标优化效果较好,总体上有优化效果。但仍然存在以下问题1)CRF对于各类和水交界,荒地与树木交界、荒地与草地交界、农田与树木交界这些分界较为明显的预测图的优化有积极效果,而对于分界不明显,存在相似度的类别优化存在消极效果。2)开源数据集所提供的标注数据视野比较大,经过数据预处理后,数据分辨率降到224*224,使得数据丢失大量原始的局部信息,在草地、农田,建筑群之间轮廓不是特别明显,通过CRF来进行优化可能会得到消极效果。本文标注开源数据////图 17 本文标注数据与开源标注数据比较利用Google地图选取德国某地区大片农田卫星图片进行分割测试,如图18所示,对比原始图片,大片的农田部分的大致位置、面积还是能够正确分割。通过计算像素占比,结合获取的卫星图像比例尺,得到大致的区域农用土地信息,为农业的区域发展、统筹规划等需要快速、大量获取地区农业土地信息等领域提供有效信息,此方法是有效可行的。/图 18 大片农田分割效果5 总结与展望5.1 总结 论文主要完成数据标注、基于FCN语义分割、利用CRF优化FCN预测结果,对比FCN和FCN+CRF在不同数据集上的分割效果。在实现过程中,存在以下不足1)FCN虽然完成了图片数据的输入到图片输出的输出,保留了部分像素空间位置信息,但是没有很好地考虑像素与像素之间的联系,即使使用跳跃结构将较浅层次的特征图与较深层次的特征图融合,其效果仍然不是特别理想。2)CRF对FCN的预测结果总体上有优化效果,使得分类目标轮廓更加细致,但是CRF的优化存在一定的局限性。对于颜色对比度比较大的分类目标优化有积极效果,而对于小目标以及某些分类边界不够明显的优化存在消极效果。3)对于原始图像,由于有的时候为了减少运算量和训练时间,一般会将数据图片进行尺寸调整、减小,这样操作会使原图像丢失很多特征信息。在保留分类对象的足够全局特征的情况下,可以将数据图片进行分切,再进行尺寸调整。在保留更多的细节特征的同时,不会减少太多分类对象的全局特征,又能增加数据量。4)即使通过旋转方式成倍增加数据量,但是本文数据集数量仍然较少,大量数据的数据基础是提高深度学习网络模型的泛发性的重要手段。过少的数据量可提供学习特征有限,使得训练容易产生过拟合现象,测试效果不理想。 与此同时,所获取的遥感卫星图局限于某一区域,必然存在不同形状,不同颜色特征的同类型没有被覆盖到。5.2 展望1) 论文实现了基于FCN+CRF的语义分割,从结果上看,效果并不是特别理想。现在已经出现分割精度远高于FCN的网络模型,其大多数提升技术是基于FCN改进,经过FCN的学习之后,学习吸收新的神经网络知识相对较为容易,下一步可进行先进的语义分割技术学习。2) 论文所用数据基本是平原地区卫星图,农田形状大多数比较规整,而山地地区存在许多不规整的形状。很多卫星图像的语义分割研究也很少看到基于山地地区的卫星数据来研究,所以对山地地区高分辨率遥感卫星图分割效果还待验证。2) 从实际训练中容易得到,数据的标注信息的质量、数量、有效性直接影响到神经网络模型的性能,标注图的标注细致,数据图片中所包含的细节信息就多。针对数据获取难度大的问题,共享数据能够在一定程度上缓解数据压力,但依然存在一些领域的数据基本处于空白。如何快速、方便获取大量有效的数据依然是深度学习所面临的问题。4) 通过实践感受到,学习、工作的任何过程,即使简单的操作都会影响的整个实验、工作的最终效果,必须要学会全面地考虑每一步操作意义和可能的结果,养成严谨的科研、学习及工作的态度。致谢感谢大学给予我优秀的学习环境,浓厚的学习氛围,让我的学习和生活变得充实。感谢国内外的技术资料,科技的前沿者,参考文献的作者以及出版社,感谢他们提供大量优秀的技术和文献。参考文献
目录
摘要 1
关键字 1
Abstrac 1
Key words 1
1 绪论 1
1.1 选题背景 1
1.2 国内外研究 2
1.3 应用前景 2
1.4 本文结构 3
2 分割算法介绍 3
2.1 全卷积网络FCN 3
2.2 全连接条件随机场 4
3 基于FCN实现分割 5
3.1 数据集获取 5
3.1.1 开源数据集 5
3.1.2 本文标注数据集 5
3.2 训练环境搭建 7
3.3 FCN训练 8
3.3.1 数据预处理 8
3.3.2 参数初始化 8
3.4 测试结果分析 9
4 基于CRF实现优化 12
5 总结与展望 14
5.1 总结 14
5.2 展望 14
致谢 15
参考文献 15
基于全卷积网络的农田遥感卫星图像语义分割
引言

原文链接:http://www.jxszl.com/jsj/jsjkxyjs/563904.html