2.深度学习算法研究现状 鉴于人工智能的迅速发展,深度学习在计算机视觉、语音识别和自然语音处理等方面具有很强的优势,在模式识别领域应用十分广泛。深度学习是一种包含多层人工神经网络的机器学习模型,经过大量数据的训练后能够学习到更有效的特征信息。美国大学教授Yan于1998年首次把深度学习中卷积神经网络应用于手写数字字符识别并获得了成功,使得深度学习在字符识别上的应用成为一个热门方面。在2011年微软公司研发了一款基于深层次神经网络的语音识别系统。深度神经网络包含多个隐藏层,可以通过反馈训练充分提取信息特征,因此可以很好的表征原信息。深度学习来源于对人工神经网络的研究。深度学习中的深度是指网络层数量级比较大。随着科技的进步各种机器学习模型陆续被提出,例如支持向量机(SVM),逻辑回归(LogisticRegression),Adaboost分类器等等。这些机器学习模型比以前的基于人工规则的算法,在不同的方面都表现一定优秀性。上个世纪的八十年代末期,科技工作者发明了用于人工神经网络的反向传播算法(BP算法),推动了机器学习的发展,直到现在人工神经网络的反向传播算法还在各个领域有着广泛的应用。但不足的是这些模型的结构基本上只有一层隐藏层,或者没有隐藏层。这些模型虽然在理论算法研宄和实际生产应用上取得了一定的成绩。但随着科技的进步,以及计算机的计算能力不断提升,这些浅层的机器学习模型己经显示出不足和缺点。 2006年,加拿大多伦多大学的Hinton教授等研宄人员在Science上发表篇文章,指出了关于对人工神经网络的改进。人工神经网络不仅仅局限于单个隐藏层,从而掀起了了人们对人工神经网络在多层隐藏层下,神经网络有如何的表现,并提出了各种深度学习的机器学习模型的热潮。深度学习的本质是构建包含有多个隐藏层的机器学习模型,并使用大量的训练数据,来学习特征最后达到提高分类和检测的精确率的目的。目前,深度学习在图像识别、语音识别等方面,不仅在学术研究领域而且在工业生产中都得到了广泛的应用。在2012年的ImageNet2012的比赛上,Krizhevsky等研宄人员提出的AlexNet网络模型,这种模型是对卷积神经网络结构的改进,并用ImageNet1421图像识别据库在计算机视觉挑战赛比赛中获得了冠军并将分类的误差从26%降到了15%。2015年,来自中国4名研宄员何凯明等人通过深度学习模型残差网络在大规模视觉识别挑战赛中获得了第一名,在ImageNet测试集中,残差网络整体达到了3.57%的误差,而人类的误差率为5.1%。由于深度学习在比赛中取得了良好的实验结果,所以在以后的比赛中,大部分参赛小组都采用深度学习的方法来进行计算机视觉挑战赛的比赛,由此可以看见,深度学习在图像识别,目标检测等方面比传统目标检测方法的有很强的优越性。而在车牌字符识别方面,深度学习对图像包括形状,清晰度等有很强的畸变容忍性,能够有效克服车牌字符的不同形态、角度、倾斜程度带来的困难。所以本文通过深度学习的方法来对车牌字符进行识别。