软件工程硕士论文范文第二篇:研究深度学习的目标检测与搜索算法本篇文章目录导航:[]研究深" />

"景先生毕设|www.jxszl.com

[免费论文]探究深度学习的目标检测与搜索算法

2020-05-27 11:57编辑: www.jxszl.com景先生毕设
点击查看其他>>软件工程硕士论文(精选6篇)软件工程硕士论文范文第二篇:本篇文章目录导航:[]??[第一章]深度学习的视频运动目标绪论[第二章]学习视频运动目标相关工作 更多精彩就在: 51免费论文网|www.jxszl.com 
[第三章]卷积神经网络的视频目标定位检测[第四章]时空双流的视频人物动作检测[第五章]循环神经网络的视频目标自然语言搜索[第六章]目标检测与搜索算法的结论与参考文献摘要检测和搜索视频中的目标是计算机视觉领域的重要任务之一,其主要难点在于如何运用深度学习等算法来剖析出视频中目标的位置以及如何根据查询条件搜索到视频中准确的目标.近年来传统的深度学习算法对于单张静态图片的识别以及文本描述生成取得了较大的进展,但仍然不能满足视频中目标的检索要求.本学位论文以检测与搜索出视频中的目标物体为探究目标,首先提出一种边界概率卷积神经网络模型的目标定位检测算法来识别与定位视频中的目标,再通过一种时空双流特征融合的3D卷积神经网络完成视频中人物的动作检测,最后通过一种循环神经网络(GRU)模型的自然语言目标搜索算法来完成视频中的目标搜索.此外,本文在图像的目标检测数据集PASCALVOC上完成目标的定位检测实验,在人物动作数据集UCF-101和HMDB51上完成视频人物动作检测实验,在目标标注数据集ReferIt上完成视频目标的自然语言搜索实验.实验结果证明,本文提出的深度学习的目标检测与搜索算法在一定的程度上改进了已有的方法.本文的工作创新主要体现在以下三个方面:(1)利用一种目标候选框边界概率的卷积神经网络模型,计算出目标候选边界框的四条边在一定搜索区域上的概率,获得更加接近人工标注边框的候选,通过迭代的方式与目标识别模型进行融合.(2)将预先训练好的空间流与时间流动作检测网络在深度卷积层进行融合,利用融合后的时空双流动作检测模型提取中层时空特征提取,之后利用3D卷积神经网络模型完成视频人物动作检测.(3)利用卷积神经网络并行的抽取局部目标区域和全局的特征,通过两层的门循环神经网络融合这两方面的特征以及自然语言搜索语句的特征来完成自然语言目标搜索.关键字:深度学习;目标检测;动作检测;目标搜索;门控循环单元(GRU);自然语言AbstractDetectingandretrievaltheobjectinvideoisanimportanttaskinthefieldofcomputervision.Themaindifficultyliesinhowtousethedeeplearningalgorithmtoanalyzethepositionoftheobjectinvideoandhowtosearchforaccurateobjectinvideobasedonquerycriteria.Inrecentyears,thetraditionaldeeplearningalgorithmhasmadegreatprogressintherecognitionofsinglestaticimagesandthegenerationoftextdescription.However,theretrievalrequirementsforthetargetinvideocannotbemet.Inthisthesis,thegoalistodetectandretrievaltargetobjectsinvideo.Firstly,atargetlocationdetectionalgorithmbasedontheboundaryprobabilityconvolutionneuralnetworkmodelisproposedtoidentifyandlocatetheobjectinvideo.Then,a3Dconvolutionalneuralnetworkbasedonspatio-temporalcharacteristicsfusionisusedtoperformtheactiondetectionofthecharactersinvideo.Finally,anaturallanguagetargetsearchalgorithmbasedontheGatedRecurrentUnit(GRU)isusedtocompletetheobjectretrievalinvideo.Inaddition,thisthesiscarriesoutthetargetdetectionexperimentonPASCALVOC,carriesoutcharacteractiondetectionexperimentonUCF-101andHMDB51,andcarriesoutnaturallanguageobjectretrievalexperimentonReferIt.Theresultsshowthattheobjectdetectionandretrievalalgorithmbasedondeeplearninghasimprovedtheexistingmethodstoacertainextent.Theworkofthethesisismainlyreflectedinthefollowingthreeaspects:(1)Usingaconvolutionbasedontargetcandidatesboxborderprobabilityneuralnetworkmodel,calculatingthetargetcandidateboundingboxofthefoursidesinacertainprobabilityonthesearcharea,gettingacandidateboxclosertothegroundtruthbox,andintegratingwiththeobjectrecognitionmodelthroughiteration;(2)Fusingthepre-trainedspatialandtemporalnetworkinthedepthconvolutionlayer,usingthecombinedspatio-temporalmodeltoextractthespatio-temporalfeature,andusingthe3Dconvolutionneuralnetworktocompletethedetectionofactionsforcharactersinvideo;(3)Usingaconvolutionneuralnetworktoextractthefeaturesoflocalobjectregionandglobalimageinparallel,andusingatwo-layergatedrecurrentunittocombinethesetwofeaturesandthefeatureofnaturallanguagestatementfornaturallanguageobjectretrieval.Keywords:DeepLearning;ObjectDetection;ActionDetection;ObjectRetrieval;GatedRecurrentUnit(GRU);NaturalLanguage目录第一章绪论1.1课题探究的时代和意义1.2视频目标检测概述1.2.1视频目标检测基本概念1.2.2视频目标检测方法1.3视频目标搜索概述1.3.1视频目标搜索基本概念1.3.2视频目标搜索方法1.4课题探究思路和创新点1.5论文主要探究工作及结构第二章相关工作2.1视频的预处理2.1.1镜头分割2.1.2关键帧提取2.1.3RGB颜色通道提取2.2CNN在视频图像识别中的应用2.2.1CNN的网络结构2.2.2CNN的算法原理2.3目标候选区域提取算法2.3.1SlidingWindow算法2.3.2SelectiveSearch算法2.3.3EdgeBox算法2.4RNN在文本的目标搜索中的应用2.4.1RNN的网络结构2.4.2RNN的算法原理2.4.3GRU神经网络2.5本章小结第三章卷积神经网络的视频目标定位检测3.1问题描述3.2边界框概率的卷积神经网络定位模型3.2.1边界框概率预测原理3.2.2边界框概率表示法3.2.3深度卷积神经网的定位模型框架设计3.3视频目标的定位检测算法流程设计3.4实验与结果剖析3.4.1实验设计3.4.2结果剖析3.5本章小结第四章时空双流的视频人物动作检测4.1问题描述4.2时空双流的融合特征提取4.2.1空间流卷积神经网络4.2.2时间流卷积神经网络4.2.3时空特征融合策略4.33D卷积神经网络的人物动作检测4.3.1整体框架设计4.3.23D卷积神经网络动作检测4.4实验与结果剖析4.4.1实验设计4.4.2结果剖析4.5本章小结第五章循环神经网络的视频目标自然语言搜索5.1问题描述5.2GRU自然语言搜索模型框架设计5.3SGRC模型的迁移学习5.3.1图片文本描述数据集上的预训练5.3.2图像目标自然语言搜索数据集上的微调5.4实验与结果剖析5.4.1实验设计5.4.2结果剖析5.5本章小结第六章总结与展望6.1工作总结6.2工作展望参考文献
原文链接:http://www.jxszl.com/lwqt/mflw/16752.html