"景先生毕设|www.jxszl.com

基于深度学习的语音识别模型在植保领域的应用【字数:6399】

2024-02-25 17:23编辑: www.jxszl.com景先生毕设
飞速发展的社会经济,催生了大数据时代的到来;伴随着人工智能在全球范围内的蓬勃兴起,促使深度学习成为当下热门的研究方向,并且已经逐步应用到图像识别、语音识别和机器的翻译等多个场景中,极大地推动了工业、农业、机械制造业等多个领域的发展。随着深度学习的逐步成熟,在农业植保领域的应用也日益广泛。本研究在深度学习的基础上通过采集关键词,构建语料库,通过机器学习训练,测试出的模型最终达到的准确率在90%以上,因此实现了较高质量的人机交互。这也表明了深度学习在语音建模上的可行性和实用性,预示着未来新型农业植保方向的发展。
目录
摘要1
关键词1
Abstract1
Key words1
引言1
1 材料与方法2
1.1音频数据样本的采集2
1.2音频样本的处理3
1.3投入语音模型的训练3
2 结果与分析3
2.1 关键词样本获取结果分析4
2.2 基于TensorFlow的训练结果分析4
3 讨论5
3.1实验总体评价及之后计划5
3.2 提高实验准确率的方法讨论5
3.3 该研究在植保领域的应用及意义6
致谢6
参考文献7
基于深度学习的语音识别模型在植保领域
的应用
引言
现代的语音识别跨越了语言学、心理学、数理与统计等多个领域,使得计算机能够智能化的处理语音。语音识别(Speech Recognition)[1]是指计算机能够识别人类的语音内容,并且将其转化为相应的指令,从而达到人机交互的语音识别技术。
语音识别的工作过程主要分为三个步骤:把帧识别成状态;把状态组合成因素;把因素组合成单词。由于不同帧会对应不同的状态,且所对应的不同状态之间存在不同的概率。为了读取这个概率,引进了“声学模型”的概念。声学模型作为语音识别系统中最为重要的部分之一,应用于声学建模的最常见模型有隐马尔可夫模型(HMM)、高斯混合模型(GMMHMM)、深度神经网络模型(DMMHMM)[2]等。
21世纪初,在普渡大学,有研究人员做了一项试验,即 *景先生毕设|www.jxszl.com +Q: @351916072
利用带有单个耳机的麦克风收集语音输入,同时允许操作员听到外部声音。研究人员根据硬件要求和添加新术语的能力选择了四种不同的语音识别产品,并通过在大豆田中行走时将这四种系统携带在背包中来进行侦察测试,系统用每个话语记录一个点或一系列点。该实验总共测试了132个词汇,训练后结果显示Kurzweil VoicePlus和Verbex这两种产品的语音识别准确度为100%。研究人员把数据显示为Excel图表,并显示收集数据时的实时地图,该信息稍后在远程感测的场图像上显示在GIS中[3],大豆收获期间通过使用声音定位杂草斑块进行测试。传统生产上,当收割机进出于杂草斑块或作物架较差的区域时,收割机操作员由于计算机经验的不足,难以利用传统的计算机进行控测。但是基于语音识别的系统,可以使操作更为简单便携,普及范围更广,可以在步行或驾驶时收集现场数据,从而为精确农业生产操作提供所需信息[4]。这个实验是语音识别应用于农业生产的开创性操作。
但是在之后的试验中,也逐渐凸显出了传统语音识别存在的诸多问题。传统的语音识别系统较为复杂,并且依赖于艰苦的工作;与此同时,在应用于存在噪声的环境中,它的使用效果存在较大的欠缺。传统意义上的语音模型,包含有多个工程处理阶段的步骤,其中有特定的特征输入、声学模型以及隐马尔可夫模型(HMM)。要对它们进行优化,就必须投入大量的精力来调整它们的特性和模型。语音系统引入深度学习算法[5,6]后大大提高了性能,这有赖于深度学习较之传统模型的一个突出优点能够对多层非线性进行计算,可以对大量的语料库进行处理;采用深度学习,使用递归神经网络,结合深度学习系统提供的能力,对大型数据进行集中学习,可以提高整体性能,大幅度提高识别准确率[7],并且能将成功拟合之后的模型投入到应用中。从而深度学习和语音识别相结合成为必然的选择。
深度学习系统显著的地提高了语音识别模型的准确性,近些年来,随着深度学习概念的不断深化,研究者们已经研发出了具有显著优越性的各种深度构架及学习方法。TensorFlow[8]是谷歌公司于2015年开发的,它是一种基于图计算的软件开发源和跨平台的深度学习框架。
TensorFlow 能够支持的不仅是循环经网络(RNN) 、短期记忆网络(LSTMN),还能够支持卷积神经网络(CNN)等深度神经网络模型[9],它的性能相比于传统模型具有质的飞跃,因此能够跨越图像识别、语音模型,机器翻译[10]等多个不同的深度学习领域[11]进行应用。它降低了深度学习在各个行业中的应用难度,并且在性能的提升上,具有开拓性的意义。
田间调查是农业技术人员的日常工作,数据记载是其中的重要环节,在传统的植保病虫害调查中,田间数据记载目前都是手工记账,费时费力,至少要占用三分之一以上的时间,不可避免的会出现漏记错记的情况。本实验整理统计整理出了植保领域常用的关键词,在此基础上,运用Tensorflow的深度学习构架,首先对语音识别的模型进行迁移学习,再从中提取特征,然后用提取出的特征构建出一个声学模型,并且用所构建出来的声学模型对语音序列进行识别。实验的重点在于如何将深度学习系统应用于关键词的识别,利用神经网络的有效的提取鲁棒性潜在的功能,并且提高实验的识别准确性[12]。
1 材料与方法
1.1音频数据样本的采集
表1关键词列表
控制
开始
结束
暂停
病虫
分级
零级
一级
二级
三级
四级
五级
六级

原文链接:http://www.jxszl.com/nongxue/zwbh/564095.html