多角度奶牛面部识别研究【字数:10871】
ent, it was found that the recognition effects of the LBP and improve LDP feature were best. When combined with the shape feature, the recognition rates reached 94.24% and 93.42% apparently on the Cow_Soft test set. (2) By applying the LeNet - 5 network model to the cow face recognition system and improving it through adding the regularization and Dropout technology, the recognition rate of deep learning method on two image sets both achieved more than 99% . (3) Testing the two methods with different sample sets of different sizes, it was indicated that the recognition accuracy of cow face based on deep learning was mostly better than that based on feature extraction.Key WordsCNN; Local Directional Pattern; Local Binary Pattern; LeNet-5所以将奶牛的个体识别与计算机视觉相联系,建立多角度的牛脸识别系统,可以促进养殖业现代化的发展,降低饲养员的工作强度,提高养殖效率。绪论国内外研究现状动物个体识别研究现状动物的行为识别一直是研究的热点,而动物行为识别研究的基础是动物的个体识别。为了达到无损伤、高效率、低成本的识别动物个体,越来越多学者开始进行图像处理与动物个体识别相结合的研究。如赵伟和朱伟兴使用Gabor方向直方图提取猪体毛发模式特征,并将该特征应用于猪的个体识别 [6];赵凯旋和李国强将卷积神经网络与奶牛个体识别相结合,提取奶牛全身斑块作为识别特征 [8];张满囤等利用了传统 KPCA方法与小波变换相结合,应用于奶牛个体识别方面[1];刘杰鑫等提出了基于高斯混合模型与卷积神经网络相结合的奶牛个体识别方法,利用高斯混合模型获取奶牛个体图像数据库,利用卷积神经网络实现奶牛个体的准确识别[5];赵婷婷等提出了基于深度学习的金钱豹个体识别,深度学习模型为Cifar-10模型[4]。动物面部识别研究现状随着人脸识别技术逐渐成熟,很多学者开始将面部识别技术应用于动物个体识别上,因为面部相较于身体不容易因为动作而产生较大的形变,识别效果会更好。Crouse 等提取狐猴面部特征来进行个体识别[10];Freytag 等利用卷积神经网络提取黑猩猩的面部特征进行个体识别[20];方楠利用卷积神经网络依据川金丝猴的面部特征进行个体识别[11];也有一些学者将面部识别技术应用于牛脸识别,如吕昌伟提出了一种基于深度学习与稀疏表示的增量识别算法框架,可以在增加样本时不需要重新训练模型,并将该框架应用于牛脸识别[12];Cheng Cai和Jianqiao Li提出了一种基于LBP的牛脸识别方法[14],但这方面相关的研究还比较少。图像集建立图像集构建 原始图像集的采集时间为8月31日至9月16日000-2400,采集地点为内蒙古自治区鄂尔多斯市的一家奶牛养殖场,其中包括15头奶牛正面、左侧、右侧三方向的面部图像,每头奶牛拥有图像数量不等,共4050张,归一化后尺寸为100*100像素。通过原始图像集建立适合本文的图像集,主要包括以下几个步骤1)对原始图像集进行分类存储,本文主要创建2个新的图像集,分别为光照影响弱的图像集Cow_Soft和光照影响强的图像集Cow_Bright,两个图像集中包含奶牛面部正面、左侧、右侧三个方向的图像,共2250张。2)对图像集Cow_Soft和Cow_Bright,根据方向进行二次筛选。将图像集Cow_Soft分为三个子图像集,Cow_Soft_F, Cow_Soft_L, Cow_Soft_R。将图像集Cow_Bright分为三个子图像集,Cow_Bright_F, Cow_Bright_L, Cow_Bright_R。每个子图像集有750张图像,其中每头牛约有50张图像。以编号为1的奶牛为例,展示其在两个图像集中的图像,如图1和图2所示图 1 号奶牛光照影响弱图片集示例图 2 1号奶牛光照影响强图片集示例基于融合特征提取的奶牛面部识别特征提取形状特征提取1)Hu不变矩Hu不变矩的主要特点为图像经过平移、旋转和缩放后Hu不变矩基本不发生改变。设灰度图像函数为,对于离散图像,图像的p+q阶标准矩定义为 (1)图像的中心距定义为 (2)其中代表图像的重心, 的归一化中心距定义为 (3)利用二阶和三阶归一化中心矩构造了7个不变矩~ (4) (5) (6) (7) (8) (9) (10)2)提取过程a.提取轮廓对图像二值化处理,使用Canny算子提取奶牛面部轮廓。因为背景为黑色,所以Canny算子提取的轮廓为奶牛面部白色花纹的轮廓,选取所有轮廓中最长的轮廓作为面部花纹的主要轮廓。b.近似多边形使用道格拉斯-普克算法(Douglas-Peucker)对奶牛面部花纹的主要轮廓进行多边形近似操作。它主要用于压缩大量冗余数据点和提取重要数据点,减少后续计算。c.提取Hu不变矩根据公式(4)-(10)提取Hu不变矩。颜色特征提取颜色特征是一种应用十分广泛的特征,因为颜色特征不太依赖于图像本身的大小和角度。1)黑白像素比黑白像素比为图像经过阈值化后,黑色像素与白色像素在图像中所占比例。纹理特征提取1)基本LBP算子LBP(局部二值模式)是一种用来描述局部纹理特征的算子,提取过程如图3所示图 3 LBP特征提取过程LBP算法在一个3*3的邻域中进行计算,将中心像素的灰度值与中心像素周围的8个人像素的灰度值进行比较,将灰度值大于标准灰度值的像素标记为1,将灰度值小于等于标准灰度值的像素标记为0。于是在这个3*3的邻域内,得到了除中心以外的8个二进制数,以顺时针方向将8个二进制数排序,得到一个二进制数序列,将该序列转为十进制数,就得到了中心像素的LBP值。 (11)其中表示邻域的中心元素,表示中心元素的像素值,表示其他像素的值。s(x)是符号元素。 (12)2)基本LDP算子图 4 LDP特征提取过程图 5 八个方向的Kirsch模板LDP(局部方向模式)特征提取过程如图4所示,提取基本思路是每个像素都主要在3*3的邻域中进行计算。将该邻域与8个方向的Kirsch模板进行卷积操作,Kirsch模板如图5所示,卷积后得到8个方向的值,记作mi(i=0,1,7)。对8个方向的绝对值进行排序,选取其中最大的前k(本文取3)个数,记为1,其他方向记为0。以顺时针方向将8个二进制数排序,得到一个二进制数序列,将该序列转为十进制数,这个十进制数就是这个像素的LDP值。 (13) (14)3)改进LDP算子LMDPLMDP基于传统LDP算子的改进算子,该算子由学姐改进。主要思想为将传统LDP算子的3*3邻域改为5*5邻域,并将传统的8个方向的卷积运算改为12个方向的卷积运算。4)提取过程a.裁剪初始奶牛面部图片有大面积的黑色背景,过多的背景会在识别过程中影响识别结果。因此对所有奶牛图片进行裁剪,仅保留奶牛的面部,去除多余背景。b.提取特征使用上述方法对裁剪后图像提取LBP、LDP和LMDP特征图片。如图6所示图 6 LBP、LDP、LMDP特征图像c.分块将特征图像进行分块,分成m*n块,为每一块分块图像构造直方图,得到m*n个分块的直方图。本文m*n取4*5.d.连接直方图将c得到的m*n个直方图相连,作为最终的特征向量。如图7所示图 7 直方图连接过程分类器提取奶牛面部特征后向量后,还需要对特征向量进行相似性判断,以此来区分特征向量表示的是哪一类别。本实验使用BP神经网络作为分类器。BP神经网络BP(back propagation)神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络。本文采用经典的三层BP神经网络,输入层的神经元数量由输入特征的数量决定,输出层神经元数量为15,隐含层神经元个数为20。形状特征实验结果使用上述方法提取Hu不变矩特征特征,使用BP神经网络进行训练与分类,数据集分别为Cow_Soft_F, Cow_Soft_L, Cow_Soft_R和Cow_Bright_F, Cow_Bright_L, Cow_Bright_R。为的到更准确的测试结果,每种特征测试120次,取平均识别率。实验结果如表1所示表 1 Hu不变矩在两个图像集上的识别效果图像集正面图像左侧图像右侧图像平均识别率Cow_Soft58.64%48.56%49.36%52.19%Cow_Bright58.74%48.74%48.55%52.01%可以看出在两个图像集上的结果基本一致,说明Hu不变矩基本上没有受到光照的影响,不过单独使用Hu不变矩作为特征的识别准确率过低。颜色特征实验结果使用黑白像素比作为特征,分别使用Cow_Soft_F, Cow_Soft_L, Cow_Soft_R和Cow_Bright_F, Cow_Bright_L, Cow_Bright_R作为图像集。分类器使用BP神经网络,实验结果如表2所示表 2 黑白像素比在两个图像集上的识别效果图像集正面图像左侧图像右侧图像平均识别率Cow_Soft56.57%40.28%44.34%47.06%Cow_Bright32.56%27.74%33.1%31.13%由于Cow_Bright图像集上受到光斑的影响,会导致黑白像素比的识别率比Cow_Soft图像集的结果更差。纹理特征实验结果参数的选择共有3个方向的奶牛面部图像,每头奶牛的图像为一类,共15类,每类包括50张图像。每个方向共750幅图像,其中650幅用于训练图像,剩下100幅作为测试图像。1)不同分块方案下的识别结果提取纹理特征LBP、LDP和LMDP时,要将分块后每块的灰度直方图连接,分块数量与输入特征有很大的关系,所以不同的分块数量可能会影响整体的识别准确率。本文使用灰度直方图的分级数为255级,以Cow_Soft_F为数据集,分别用三种纹理特征算子,测试奶牛图像进行不同规格的分块时的识别效果,实验结果如表3,表4,表5所示表 3 不同分块规格LBP在测试集上的识别效果规格总块数平均识别率平均时间消耗1*4459.981.23112*2463.351.28833*3968.752.31414*41672.734.08854*52079.004.80455*52577.756.9696表 4 不同分块规格LDP在测试集上的识别效果规格总块数平均识别率平均时间消耗1*4446.20%1.14942*2452.48%1.18733*3971.03%2.24824*41672.95%3.71374*52073.93%4.76235*52562.80%5.2686表 5 不同分块规格LMDP在测试集上的识别效果规格总块数平均识别率平均时间消耗1*4448.951.20732*2458.251.23373*3969.202.28844*41676.003.94004*52077.454.88305*52568.736.3027实验结果表明,分块数量与识别准确率有很大关系,分块数量越少,每块包含特征较多,经过直方图压缩后,输入特征较少,所以识别的准确率也会降低;观察上表可以发现当分块数量超过20块时,识别率反而会有所下降,而且分块数量越多,输入特征向量就会越大,读取和计算的时间开销就会增加,所以选择将分块规格定为4*5,共20块。2) 不同灰度级下的识别结果灰度直方图是对图像中灰度级分布的统计,默认灰度级为255级,为压缩数据可以将几个灰度级合并,减少灰度级总数,到达减少特征输入的目的。本文以Cow_Soft_F为数据集,分块规格定为4*5,使用三种纹理特征测试不同压缩程度的灰度级的识别效果,实现结果如图8,图9所示图 8不同灰度级数量下的平均识别度图 9 不同灰度级数量下的平均时间消耗实验结果表明,灰度级越多输入的特征向量就越大,读取和计算的时间开销就会增加;灰度级过小会导致特征向量无法很好的描述图像,导致识别准确率降低。所以选取识别率和时间开销都适中的灰度级数量75.纹理特征效果提取LBP、LDP、LMDP特征,使用BP神经网络分别对奶牛的三个方向的图像进行训练与分类,为得到更准确的测试结果,每种特征测试120次,取平均识别率。分别使用Cow_Soft图像集和Cow_Bright图像集的实验结果如表6,表7所示表 6实验在Cow_Soft图像集上的实验结果特征正面图像左侧图像右侧图像平均识别率LBP92.73%94.30%95.70%94.24%LDP90.75%90.40%90.30%90.48%LMDP93.44%92.75%94.06%93.42%表 7 实验在Cow_Bright图像集上的实验结果特征正面图像左侧图像右侧图像平均识别率LBP88.67%91.53%90.72%90.31%LDP83.88%78.93%84.53%82.47%LMDP87.43%86.43%90.75%88.20%实验结果表明无论是哪个数据集,三种纹理特征的实验结果都是LBP特征和LMDP特征的识别效果较好,而传统的LDP特征识别效果较差。在有光照影响的情况下,LBP特征的平均识别率降低了3.93%,LDP特征的平均识别率降低了6.68%,LMDP特征的平均识别率降低了5.22%,由此得出LBP特征的总体识别效果较好,受光照的影响也较小。融合特征为提高识别效果,将纹理特征与颜色特征和形状特征融合。纹理特征与颜色特征融合添加黑白像素比特征,将融合后的特征向量在Cow_Soft图像集的图像集上测试,实验结果如表8所示表 8 添加黑白像素比后的测试效果传统特征正面图像左侧图像右侧图像平均识别率LBP+黑白像素比94.2%94.4%93.59%94.06%LDP+黑白像素比88%90.14%88.6%88.91%LMDP+黑白像素比92.4%93.39%92.72%92.83%纹理特征与形状特征融合1)纹理特征与Hu不变矩融合共提取出7个Hu不变矩,其中前两个不变矩不变性保持比较好,其他不变矩的误差较大。因此提出两种方案,一种为使用前两个不变矩和,另一种为使用7个不变矩-,分别使用两种方案与纹理特征融合进行测试,实验结果如表9,表10所示表 9 Hu不变矩的不同添加方法在Cow_Soft图像集上的识别效果传统特征正面图像左侧图像右侧图像平均识别率LBP+、92.53%95.62%93.65%93.93%LBP+-89.26%93.38%93.59%92.08%LDP+、90.09%91.32%91.4%90.93%LDP+-86.38%90.6%90.13%89.03%LMDP+、92.39%91.25%93.45%92.36%LMDP+-90.63%91.63%92.25%91.40%表 10 Hu不变矩的不同添加方法在Cow_Bright图像集上的识别效果传统特征正面图像左侧图像右侧图像平均识别率LBP+、91.80%90.90%90.32%91.01%LBP+-88.83%88.63%86.45%87.97%LDP+、84.35%83.88%83.15%83.79%LDP+-83.03%80.50%82.15%81.89%LMDP+、88.33%88.58%88.05%88.32%LMDP+-86.63%85.28%86.95%86.29%实验结果表明-阶Hu不变矩存在较大误差,所以最后选取只添加前两个不变矩和作为特征。但Hu不变矩在提取纹理比较丰富的图片时,识别准确率较低,并且由于拍摄角度的差别,可能也会导致识别率较低。由两表中可以看出,在Cow_Soft图像集上的实验结果并没有提高,在Cow_Bright图像集上的实验结果也只有细微的提升。2)融合Hu不变矩的基础上添加其他形状特征形状特征中还有面积、周长等特征,由于图像集中的样本会因为图像缩放有区别,所以面积和周长都不能单独作为特征进行训练,所以添加一个面积/周长(S/L)作为特征,减少由于缩放所带来的误差。选取两个图像集中识别率较高的特征,添加面积/周长特征(S/L),进行对比实验。实验结果如表11,表12所示表 11 添加面积/周长特征后在Cow_Soft图像集上的识别效果传统特征正面图像左侧图像右侧图像平均识别率传统平均识别率LBP+、+S/L95.12%94.34%93.75%94.40%94.24%LDP+、+S/L92.00%90.78%91.30%91.36%90.48%LMDP+、+S/L94.62%94.32%93.50%94.15%93.42%表 12 添加面积/周长特征后在Cow_Bright图像集上的识别效果传统特征正面图像左侧图像右侧图像平均识别率传统平均识别率LBP+、+S/L90.57%90.42%90.95%90.65%90.31%LDP+、+S/L87.80%85.72%83.30%85.61%82.47%LMDP+、+S/L90.20%89.85%89.95%90.00%88.20%由以上实验可以看出添加了Hu不变矩以及面积/周长特征的特征向量,平均识别率上都有细微的提升,其中在Cow_Bright的数据集上的提升较多。多角度的奶牛面部识别经过一系列的实验,选用添加了Hu不变矩(、)以及面积/周长特征的LBP、LDP、LMDP特征向量作为总体特征向量。将训练时识别效果最好的模型保存,使用大小为100的测试图像集测试多方向识别的效果。多方向的奶牛面部识别原理是,将输入特征向量分别使用之前保存的三个方向的模型进行识别,选取其中识别结果最高的标签作为识别结果。输入一个方向的特征向量的识别准确率记作A1。通过输入特征向量的标签,提取其他两个方向的特征向量,识别后得到三个标签,将标签中最多的结果作为识别结果,若三个特征向量得到三个不同的标签,选取其中识别结果最高的标签。输入三个方向特征向量的识别准确率记作A2。在两个图像集上的测试结果如表13,表14所示表 13 多角度的奶牛面部识别在Cow_Soft图像集上的识别效果传统特征A1A2LBP+、+S/L91.33%100.00%LDP+、+S/L82.67%98.00%LMDP+、+S/L85.67%97.00%表 14 多角度的奶牛面部识别在Cow_Bright图像集上的识别效果传统特征A1A2LBP+、+S/L78.67%93.00%LDP+、+S/L70.00%87.00%LMDP+、+S/L69.00%89.00%可以看出在多角度的识别系统上,对比单一角度的识别率都有不同程度的提升,因为单一角度的特征有限,而多角度提供了更多的可以识别的特征。但是这个系统存在的缺陷是需要三个角度的特征向量,如果输入的特征向量只有一个角度,识别结果还是比较差。基于深度学习的奶牛面部识别识别网络的建立卷积神经网络模型主要包括卷积层、池化层、激活函数、全连接层等构件。运用不同的构件可以构成不同的模型,经典的模型有LeNet-5、ResNet、AlexNet等。模型的结构对图像分类的准确度有决定性的作用,根据数据库的不同,所选取的网络模型也有所不同,复杂的网络模型在训练时往往需要更长的时间花费,简单的网络模型在识别的准确率上会稍低。由于实验数据集为奶牛的面部图像,奶牛的面部识别主要是基于奶牛面部的黑白色花纹,没有过多的细节特征,所以选取的网络模型不需要过于复杂,所以选取LeNet-5为基础模型。LeNet-5LeNet-5是一个比较简单的卷积神经网络,LeNet网络模型共有7层,其中有两层卷积层、两层池化层以及三层全连接层。模型结构如图10所示图 10 传统LeNet-5模型用于奶牛面部识别的网络模型,输入数据为100*100的奶牛面部图像,卷积层C1的卷积核大小为5*5,步长为1,与卷积层C1卷积后,得到的50*50的输出特征图;池化层S2的大小为3*3,步长为2,使用最大池化法,池化后得到50*50的输出特征图;卷积层C3的卷积核大小为5*5,步长为1,卷积运算后得到50*50的输出特征图;池化层S4与池化层S1一样,池化后得到25*25的输出特征图;之后连接三个全连接层,最终输出softmax为15;参数的选择评价指标1)平均识别准确率平均识别准确率是检验模型性能中最基础、最重要的一个指标。它的原理是计算每类样本中预测正确的个数占样本总个数的比例,并将所有类的正确比例求和后取平均值,这个平均值就是平均识别准确率。2)一次迭代平均时间记录网络模型训练的总时间,将总时间与迭代次数相除,计算出一次迭代的平均时间。LearnRate的选择LearnRate是指学习速率,LearnRate过高,模型会出现振荡现象;LearnRate越低,损失函数的变化速度就越慢,需要花费更长的时间来进行收敛。采用分批训练的方法训练模型,训练集和测试集的比例为82,暂时设置BatchSize为25,设置不同的LearnRate,通过对比训练集的损失值、测试集的损失值和测试集的测试准确率来确定合适的LearnRate。如图11,图12,图13所示图 11 训练集损失值曲线图 12 测试集损失值曲线图 13 测试集测试准确率曲线由上图可知,当LearnRate设置为0.1和0.01时在训练集和测试集上的损失值都下降过快,且在测试集上的准确率较差,说明LearnRate过高。当LearnRate设置为0.001和0.0001时在训练集和测试集上损失值下降速率正常,且在测试集上的准确率也几乎一致,保持在0.9左右,说明LearnRate设置的较为合适。但LearnRate为0.0001时的时间消耗比LearnRate为0.001要高,如表15所示,因此LearnRate确定为0.001。表 15模型使用不同LearnRate的时间消耗表LearnRate一次迭代平均时间0.0010.96min0.00011.09minBatchSize的选择在LearnRate为0.001时,设置不同的BatchSize,通过对比测试集的测试准确率来确定合适的BatchSize。如图14所示。图 14 测试集测试准确率曲线从图14中可知,所有BatchSize的曲线都在迭代17次后趋于稳定,稳定后,BatchSize为50时,模型在测试集的准确率较低。BatchSize为10和25时,模型在测试集上的准确率几乎一致,但BatchSize为10时,网络训练的时间花费更长,如表16所示。综合时间成本和识别效果,确定BatchSize为25。表 16模型使用不同BatchSize的时间消耗表BatchSize一次迭代平均时间101.02min250.96min迭代次数确定建立LearnRate为0.001,BatchSize为25的神经网络模型,通过对比测试集的损失值和测试集的测试准确率来确定合适的训练周期。如图15和图16所示。从图中可以看出,迭代次数为17时,测试集准确率和测试集损失值都趋于稳定。暂定训练周期为30,训练过程中保存测试集准确率最高的模型为最终网络模型。图 15 测试集损失曲线图 16 测试集测试准确率曲线感受野确定感受野用来表示网络内部的不同神经元对原图像的感受范围的大小,神经元感受野的值越大表示接触到原始图像范围越大,包含特征趋于全局;感受野的值越小表示包含特征趋于局部。将卷积层C1卷积核尺寸设置分别为7*7、5*5、3*3,对比几种卷积核训练后模型的识别效果。建立LearnRate为0.001,BatchSize为25的神经网络模型,使用不同感受野的训练模型,每个模型训练迭代次数为30次,实验结果如表17所示表 17 不同感受野在测试集上的识别效果编号类型测试集准确率一次训练平均时间5使用3*3的卷积核89.4%0.92min3使用5*5的卷积核91.3%0.96min6使用7*7的卷积核89.1%1.08min实验结果表明,当卷积核为5*5时,识别率相对较高,且一次训练的平均时间适中,所以将卷积层C1的卷积核设置为5*5。3*3的卷积核可能由于卷积核过小,特征提取趋于局部特征,导致结果较差。总结通过一系列的测试,确定了模型的结构和一部分参数,但是模型在测试集的识别效果还不够好,测试集平均识别率只有90%左右,为提高模型的识别效果还需要对模型进行一些优化和改进。优化提高性能数据集增强最初使用的数据集中每头奶牛为1类,共15类,每类包含50张奶牛面部图像,其中正面图像16张、左侧图像17张、右侧图像17张,共750张奶牛面部图像所组成。训练过程中出现训练集准确率很高而测试集准确率较低的情况,怀疑出现了过拟合的情况。推断可能是由于训练集过小,导致训练程度不够。采用仿射旋转的方法对数据集图像进行扩充,制作新的数据集,共15类别,每类包含150张奶牛面部图像,其中正面图像50张、左侧图像50张、右侧图像50张,共2250张。数据集扩充后,测试集准确率也有明显的提升,从90%左右提升至95%以上。局部响应归一化层(LRN)和dropout对模型的影响当一个复杂的神经网络被训练在小的数据集时,就容易产生过拟合现象,LRN和Dropout都是为了解决过拟合问题而提出的。LRN技术首次在AlexNet模型中提出,借鉴“侧抑制”的思想来实现局部抑制。Dropout主要是在每个训练批次中,通过忽略一部分特征,使模型不会过于依赖局部特征,提高模型泛化性。由于LRN和Dropout都是为解决过拟合提出的,因此提出四个方案,分别为(1)拥有LRN和Dropout;(2)拥有LRN,去除Dropout;(3)去除LRN,拥有Dropout;(4)同时去除LRN和Dropout; 根据上文的实验方案,测试四个网络模型的识别效果,结果如表18所示表 18 LRN和Dropout的不同方法在测试集上的识别效果编号类型测试集准确率一次训练平均时间1拥有LRN层,拥有Dropout95.1%7.32min2拥有LRN层,去除Dropout95.5%6.63min3去除LRN层,拥有Dropout98.0%3.53min4去除LRN层,去除Dropout97.1%3.00min由表18可知,在不使用Dropout的情况下,拥有LRN层的模型训练一次的时间花费更长,但测试集的准确率并没有显著提高。在不使用LRN层的情况下,使用Dropout的模型的测试集准确率更高。所以模型采取编号为3的模型,去除LRN层,增加Dropout。正则化对模型的影响正则化也是解决过拟合现象的一种方法,正则化通过对模型特征增加一些限制,自动从大量特征变量中提取重要的特征变量。本文尝试添加L2正则化,来减少过拟合现象,使测试集识别准确率更稳定。L2正则化实现起来很简单,直接在原来的损失函数基础上加上一个正则化项,表达式如公式15所示 (15)其中,是原始的损失函数计算的误差,是正则化参数,w为神经网络的权重。如图17所示,添加L2正则化后的模型在测试集上的准确率比未添加正则化的准确率更高,可见添加L2正则化对模型优化有一定作用。图 17 是否添加正则化的测试集测试准确率曲线基于LeNet的多角度奶牛面部识别系统最终模型为在传统LeNet模型的基础上,卷积层C1选用5*5的卷积核,并在结构中添加Dropout和L2正则化来减少过拟合现象。LearnRate选取0.001,BatchSize设置为25,每个模型更新迭代30次。训练集与测试集的比例为82.1)在Cow_Soft和Cow_Bright图像集上测试使用最终模型在Cow_Soft和Cow_Bright图像集上进行测试。实验结果如表19,表20所示表 19 模型在Cow_Soft图像集上识别效果图像集准确率一次训练平均时间Cow_Soft_F98.3%1.22minCow_Soft_L97.6%1.30minCow_Soft_R94.5%1.21minCow_Soft99.5%3.90min表 20 模型在Cow_Bright图像集上识别效果图像集准确率一次训练平均时间Cow_Bright_F97.1%1.21minCow_Bright_L94.2%1.53minCow_Bright_R94.6%1.13minCow_Bright99.8%3.93min由两表可知本文改进模型在Cow_Soft和Cow_Bright图像集上效果都比较好,并且在两个测试集上的准确率相差不多,说明基于深度学习的识别网络对光照不敏感,很适合应用于现实生活中。使用本文改进模型与传统AlexNet模型进行对比,对比两个模型在Cow_Soft图像集测试集上识别的准确率,实验结果如图18所示图 18 AlexNet与本文模型测试集测试准确率曲线根据实验结果可以看出,本文的模型在训练过程中测试集最高识别率可以达到99.1%,稳定后的测试集识别率也在98%以上,而AlexNet的测试集最高识别率为86.45%,稳定和的平均识别率为85%左右。特征提取方法与深度学习方法的对比不同样本集下的实验结果目前所有实验均是以2250为样本的图像集进行测试的。为对比不同样本集下的识别效果,分别建立Soft和Bright图像集,样本数分别为450、900、1350、1800,分别使用传统特征提取方法和深度学习方法进行训练和测试。 传统特征提取方法使用上文中识别率最高的添加了Hu不变矩(、)以及面积/周长特征的LBP特征作为特征向量,分别使用样本数为450、900、1350、1800的样本集训练和测试,实验结果如表21所示表 21 不同样本集上特征提取方法识别效果样本数Soft图像集准确率Bright图像集准确率45048.0%45.0%90068.0%68.0%135085.0%77.0%180093.0%87.0%2250100.0%93.0%深度学习方法使用本文改进模型,LearnRate选取0.001,BatchSize设置为25,每个模型更新迭代30次。训练集与测试集的比例为82,分别使用样本数为450、900、1350、1800的样本集训练和测试,实验结果如表22所示表 22 不同样本集上深度学习方法识别效果样本数Soft图像集准确率Bright图像集准确率45081.7%68.1%90087.6%79.3%135094.1%88.7%180096.3%92.4%225099.5%99.8%总结不同样本集上两种方法的识别效果如图19,图20所示图 19 Soft图像集上准确度的对比图 20 Bright图像集上准确度的对比由图可知,深度学习方法在不同样本数的图像集上识别效果几乎都比特征提取方法更好。但两者都会因为样本集的减少导致识别率降低,所以不管使用哪种识别方法都需要有足够多的样本集。总结与展望总结随着农业现代化的建设,畜牧业的规模也逐渐扩大,越来越多的行业开始将人工智能与模式识别应用于当前领域。所以将奶牛的个体识别与计算机视觉相联系,建立多角度的牛脸识别系统,可以促进农业现代化的发展。降低饲养员的工作强度,提高养殖效率。本文主要从深度学习方面和传统特征提取方面两方面进行研究,主要工作如下1)首先介绍了奶牛个体识别的意义,其次介绍了奶牛面部识别在畜牧业方面的重要应用。2)简要介绍了图像集的建立方法,以及图像集的组成。由于采集的图像数据各个类别的样本分布不均匀,对图像数据进行整理和扩充,方便之后实验训练识别。3)研究了基于卷积神经网络的奶牛面部识别方法,将LeNet-5模型应用于奶牛面部识别,通过加入正则化和Dropout对模型进行改进。4)然后抽取了一些传统的图像特征,包括纹理特征(LBP、LDP和改进的LDP)、颜色特征和形状特征,经过一系列实验发现LBP和改进LDP的识别效果最好,之后与形状特征融合,并进行一系列的测试。5)设计多方向结合识别的方法,并对多方向识别效果与单方向识别效果进行对比分析。对比深度学习方法和传统特征提取方法,无论从识别准确率还是识别速度上,都是深度学习方法更好一些。展望本文主要从深度学习方面和传统特征提取方面进行研究,从这两方面研究提高识别率的方法,在实验过程中发现了以下问题有待解决1)传统特征提取方法总体来说平均识别率比较低,添加其他特征后的识别效果也没有明显变化,可能由于图像集中图像素材不够多,而且角度有差别,加上选取的颜色特征与形状特征不够典型,导致识别效果没有提升。2)卷积神经网络中网络结构和层数以及很多参数的设置对实验结果会产生很大影响。想要确定这些参数需要大量的实验,设置更合适的参数,将会进一步提高识别效果。3)本文主要工作为算法的优化以及对比,在实用性和通用性上还有缺陷,未来可以实现在移动端或网页端的奶牛面部识别系统,提高系统的实用性。致谢感谢我的母校大学给了我这个学习的平台,让我在这四年可以学习和提升自己。感谢研究生学姐提供了改进算法,以及在我遇到难题时给我提供了解决思路。感谢我的家人,二十多年一直照顾我、支持我、理解我,让我有勇气有动力前行,感谢你们为我付出的一切。参考文献[1]张满囤,单新媛,于洋,米娜,阎刚,郭迎春.基于小波变换和改进KPCA的奶牛个体识别研究[J].浙江农业学报,2017,29(12):2000-2008.[3]李敦宇,薛雷,张旭.融合LBP和BP神经网络的人脸表情识别[J].工业控制计算机,2018,31(05):69-70.[4]赵婷婷,周哲峰,李东喜,刘松,李明.基于改进的Cifar-10深度学习模型的金钱豹个体识别研究[J].太原理工大学学报,2018,49(04):585-591+598.[5]刘杰鑫,姜波,何东健,宋怀波.基于高斯混合模型与CNN的奶牛个体识别方法研究[J].计算机应用与软件,2018,35(10):159-164.[6]赵伟,朱伟兴.基于Gabor方向直方图与猪体毛发模式特征的猪个体身份识别[J].江苏农业科学,2018,46(16):179-184.[7]李佳妮,张宝华.特征匹配融合结合改进卷积神经网络的人脸识别[J].激光与光电子学进展,2018,55(10):246-253.[8]赵凯旋,李国强,何东健.基于机器学习的奶牛深度图像身体区域精细分割方法[J].农业机械学报,2017,48(04):173-179.[9]侯金,郑伯川,李玉杰,白文科,齐桂兰,董峻妃,杨泽静,张晋东.基于发育网络识别模型的大熊猫面部识别[J].兽类学报,2019,39(01):43-51.[10]David Crouse, Rachel L. Jacobs, Zach Richardson, Scott Klum,Anil Jain, Andrea L. Baden, Stacey R. Tecot. LemurFaceID: a face recognition system to facilitate individual identification of lemurs[J]. BMC Zoology,2017,2(1).[11]方楠. 基于CNN的金丝猴面部识别研究与实现[D].西安:西安电子科技大学,2017.[12]吕昌伟. 基于深度学习与稀疏表示的模式识别研究及牛脸识别应用[D].银川:北方民族大学,2018.[13]高友文. 基于卷积神经网络的苹果表面伤疤识别研究[D].南京:南京邮电大学,2018.[14] Cai C, Li J. Cattle face recognition using local binary pattern descriptor[C]// Cai C, Li J. Signal and Information Processing Association Annual Summit and Conference (APSIPA), 2013 Asia-Pacific. Kaohsiung:IEEE, 2013.[15]韩习习,魏民,徐西义,李巧月,陈曦,祝汉城.基于多特征融合的交通标志识别算法[J].计算机工程与应用:1-9.[16]袁小平,王岗,王晔枫,汪喆远,孙辉.基于改进卷积神经网络的交通标志识别方法[J].电子科技,2019(11):1-5.[17]程俊华,曾国辉,鲁敦科,黄勃.基于Dropout的改进卷积神经网络模型平均方法[J].计算机应用:1-7.[18]张天飞,龙海燕,全海燕,丁娇,郭慧.基于Hu不变矩及傅里叶描述子的手势分类算法[J].电子技术与软件工程,2016(04):78-79. [19]Snoek J , Larochelle H , Adams R P . Practical Bayesian Optimization of Machine Learning Algorithms[J]. Advances in neural information processing systems, 2012, 4.[20]Freytag A , Rodner E , Simon M , et al. Chimpanzee Faces in the Wild: Log-Euclidean CNNs for Predicting Identities and Attributes of Primates[C]// Freytag A , Rodner E , Simon M , et al .German Conference on Pattern Recognition. Berlin: Springer, 2016.[21]王绎博. 基于改进LDP特征的人脸识别方法[D].南京:南京理工大学,2017.[22]张浩. 基于深度学习的皮肤疾病识别方法研究[D].杭州:浙江大学,2019.[23]黄山. 基于视觉的手势识别系统关键技术研究[D].南京:东南大学,2015.[24]钟福金,张家树.基于ILDP的噪声鲁棒人脸识别[J].光电子.激光,2012,23(08):1570-1575.
目录
摘要 1
关键字 1
Abstract 1
Key Words 1
1 绪论 2
1.1国内外研究现状 2
1.1.1动物个体识别研究现状 2
1.1.2动物面部识别研究现状 2
2 图像集建立 2
2.1图像集构建 2
3 基于融合特征提取的奶牛面部识别 3
3.1特征提取 3
3.1.1形状特征提取 3
3.1.2颜色特征提取 4
3.1.3纹理特征提取 4
3.2分类器 6
3.2.1BP神经网络 6
3.3形状特征实验结果 6
3.4颜色特征实验结果 7
3.5纹理特征实验结果 7
3.5.1参数的选择 7
3.5.2纹理特征效果 9
3.6融合特征 10
3.6.1纹理特征与颜色特征融合 10
3.6.2纹理特征与形状特征融合 10
3.7多角度的奶牛面部识别 12
4 基于深度学习的奶牛面部识别 13
4.1识别网络的建立 13
4.1.1LeNet5 13
4.2参数的选择 14
4.2.1评价指标 14
4.2.2LearnRate的选择 14
4.2.3BatchSize的选择 15
4.2.4迭代次数确定 16
4.2.5感受野确定 17
4.2.6总结 17
4.3优化提高性能 17
4.3.1数据集增强 17
4.3.2局部响应归一化层(LRN)和dropout对模型的影响 18
4.3.3正则化对模型的影响 18
4.4基于LeNet的多角度奶牛面部识别系统 19
5 特征提取方法与深度学习方法的对比 20
5.1不同样本集下的实验结果 20
5.1.1传统特征提取方法 20
5.1.2深度学习方法 21
5.1.3总结 21
6 总结与展望 22
6.1总结 22
6.2展望 22
致谢 22
参考文献 23
多角度奶牛面部识别研究
引言
原文链接:http://www.jxszl.com/jsj/jsjkxyjs/563922.html