"景先生毕设|www.jxszl.com

基于MATLAB的语音识别系统设计

2020-04-06 15:15编辑: www.jxszl.com景先生毕设
基于MATLAB的语音识别系统设计[20200406141057]
摘 要
基于MATLAB的语音识别系统设计,利用了语音识别技术结合MATLAB 7.0工具编程实现对中文数字0~9语音命令的识别,将其运用到用户注册和登录信息的验证中,从而确保了用户信息的安全。
本文首先介绍了语音识别技术的产生和发展,其次,阐述了语音识别技术的原理,使用隐马尔科夫模型对语音信号进行参数分析;然后是进行系统功能模块的划分,此系统设计共分为三个模块:语音识别编程模块、用户注册GUI和登录GUI模块,利用MATLAB 7.0工具对各模块进行设计,其中语音识别编程是全部设计的重点,其内部包括了实时录音、端点检测、语音特征参数的提取、隐马尔科夫模型等,最终通过MATLAB 自带的GUI工具进行用户注册和登录界面的设计,基于MATLAB 7.0编程将语音识别技术运用到用户的注册和登录中。
通过进行大量实验,并对实验数据结果进行分析,得到该系统对数字0~9的正确识别率达到95%以上,能够很好地证明语音识别技术在此次课题设计中的可行性。
 *查看完整论文请 +Q: 3 5 1 9 1 6 0 7 2 
关键字:语音识别隐马尔科夫模型MATLAB7.0TheDesignofaSpeechRecognition SystembasedonMATLAB
Key Words:Speech Recognition HMM MATLAB 7.0目 录
1. 绪论 1
1.1 课题来源及研究意义 1
1.1.1 课题来源 1
1.1.2 研究的目的及意义 1
1.2 国内外研究现状及分析 1
1.2.1 语音识别技术发展现状 1
1.2.2 语音识别的设计方法 2
1.3 本课题的主要研究内容 3
2. 语音识别技术理论基础 4
2.1 语音预处理 4
2.1.1 预滤波与预加重 4
2.1.2 分帧 5
2.1.3 加窗 5
2.1.4 端点检测 6
2.2 特征参数提取 6
2.2.1 短时能量 6
2.2.2 短时平均过零率 6
2.2.3 Mel频率倒谱系数(MFCC) 7
2.3 隐马尔科夫模型(HMM) 7
2.3.1 定义 8
2.3.2 基本算法 9
2.3.3 结构类型 14
2.4 本章小结 14
3. 功能实现设计 15
3.1 设计软件介绍 15
3.2 设计思路分析 15
3.3 系统功能模块设计 17
3.3.1 语音识别模块 17
3.3.2 注册GUI的设计 19
3.3.3 登录GUI的设计 19
3.4 本章小结 19
4. 仿真调试结果验证 20
4.1 仿真介绍 20
4.2 仿真调试结果 20
4.3 本章小结 25
5. 总结 26
5.1 设计遇到的问题及解决办法 26
5.2 改进与展望 26
参考文献 28
附录 29
致谢 31
1. 绪论
1.1 课题来源及研究意义
1.1.1 课题来源
传统的用户密码认证方式一般由文字组成,由于文字密码的局限性及其易被破解,用户登录密码的认证方式已逐渐由传统的文字形式向多元化发展,诸如:指纹认证、面部识别和语音识别等,这些认证方式给用户带来了较多便利,大大提高了用户信息的安全性。
研究表明,语音识别技术凭借其优越性及其独特的识别方式,因此可以在用户注册和登录界面的密码验证中用语音识别技术得以实现,从而确保用户信息的安全。
1.1.2 研究的目的及意义
语音识别是一种能够将输入的语音信号进行识别并输出为数字文本信号的过程,此识别模式主要以语音信号为主要处理对象,其涉及到教育学、心理学等较多的范畴,是一种新的识别判断模式,用MATLAB自带的语音信号处理库及其强大的信号处理能力,可实现用户输入语音信号的正确识别,将其运用到用户的注册和登录中,以提高用户认证信息的安全性。
1.2 国内外研究现状及分析
1.2.1 语音识别技术发展现状
目前,随着语音识别技术的不断成熟与迅速发展,带有语音识别功能的消费电子产品也实现了普及化,基于语音识别芯片的设计与语音识别软件的开发也不断深入,诸如著名RSC系列语音识别芯片早期就被开发,IBM公司研发的Viavoice汉语模式识别软件,安卓系统的谷歌语音翻译软件,苹果手机上的Siri助手等的广泛应用,这些都表明了语音识别技术的强大潜能,其带来的便利和安全保障无处不在。
我国也很重视语音识别技术的开发与研究,国家863计算机专家组特地对孤立词识别和连续汉语语音识别的人机对话体系进行了科研投入,最终能够将语音的辨别率提升到90%以上。近年来,诸如清华大学、华中科技大学也积极配合中科院研究所建立了国家重点实验室进行语音识别技术研发,21世纪初的“天语”系列中文识别系统的推出,掀开了中国语音识别技术的新篇章。基于不断成熟的语音识别技术,可以将语音识别技术运用到提升用户信息安全性的计划中,有效的确保用户注册和登录信息的安全。
1.2.2 语音识别的设计方法
语音识别技术主要分为语音信号预处理、特征参数提取、语音训练、语音识别四个部分,图1是语音识别系统的原理图[1]。
图1 语音识别系统原理图
(1)信号预处理
首先对原始输入语音信号的进行预滤波处理以去除不必要的杂音对后续操作的影响,然后对输入的语音信号进行预加重处理对语音的高频分量进行增强以消除口唇辐射的影响、对语言信号加窗操作便于语音信号的分帧处理、根据语音信号的短时连续性,对加窗的语音信号段进行信号加权处理来实现信号分帧、对语音信号进行端点检测以判断出语音段和非语音段便于特征参数处理。
(2)特征参数提取
主要负责语音信号的声学特征参数的计算、处理和分析,从中提取出反映语音特征的参数并保存,以便用于后期语音训练处理中。信号的时域特征主要有短时平均能量和短时平均过零率等;频域特征参数有Mel频率倒谱系数(MFCC)参数、LPCC、LPC等[2],由于MFCC在表征语音信号特征时具有良好的抗噪性及鲁棒型而被得到广泛应用,因此本文选用MFCC参数进行运算。
(3)语音训练
对采集到的语音信号进行预处理和特征参数计算后,采用Baum-Welch算法进行语音HMM模型建立,将每一次训练后的输出概率值代入重估公式中进行运算,当概率重估前后变化量的绝对值低于一定的阈值后,即可认为该语音训练模型收敛,此语音的参考模型训练结束,以此种方法对其他的语音模型进行训练,最终建立不同语音的参考模板库,并定期对其进行特征的更新或修改,以保证训练语音参考模板库为最新版本,为提高语音识别准确率打下基础。
(4)语音识别
对所需要的语音信号进行识别,首先对其进行特征参数提取并计算出其HMM参数与已经训练好的参考模板库中HMM参数进行相似性度量,此过程以Viterbi算法为判据寻找获得该语音最佳状态的概率最大值,并结合相应的判别规则进行语音识别,这种概率最大值对应的模型就是最终的识别结果。
目前,随着语音识别技术的不断进步与发展,人们根据不同的需求,相继开发出了隐马尔科夫模型、矢量量化技术、人工神经网络、动态时间调整[3]等主流算法用于语音训练和识别过程中,为语音识别的广泛应用到不同需求的领域做出了重大贡献。
1.3 本课题的主要研究内容
本课题的主要研究内容是用MATLAB 7.0编程、编译生成一脱离MATLAB环境运行的用户注册和登录的GUI的设计,其中用户名是输入用户的11位手机号,密码是为4位单独的0~9中文数字的用户语音,通过验证注册和登录界面用户名和密码的一致性,来实现用户的注册和登录,从而确保了用户信息的安全性。
(1)方案论证 将系统划分为语音识别技术编程、用户的注册GUI和登录GUI设计,共三个模块,语音识别采用HMM算法[4]进行建模,GUI的设计采用MATLAB软件自带的GUI设计工具,最终实现将语音识别技术运用到用户注册和登录的密码验证中;
(2)程序编写 用MATLAB 7.0软件自带的语音识别代码库结合课题需要加以改善实现以上各模块的有机结合,最终设计一用户注册和登录的验证界面,从而保证用户信息的安全;

原文链接:http://www.jxszl.com/dzxx/gdxx/5774.html