Merge branch 'master' of http://bdgit.educoder.net/mfayus5fk/pbygtmair
commit
fc32be37c3
@ -0,0 +1,4 @@
|
||||
字符识别原理及大致流程
|
||||
首先对输入图片进行卷积提取图片的特征,每个卷积层中通常包含若干个卷积单元,每个神经元与前一层的部分图像相连接并作为当前的输入,然后卷积单元与这个局部图像进行卷积。一般情况下,卷积神经网络卷积层含有多个特征平面,每个特征平面含有一种卷积核,用来提取某一种特征,多个卷积核可以提取图片的多种特征,这样可以充分地对图片进行特征提取。
|
||||
通过卷积层和输入图片进行卷积后,我们可以得到图片的特征信息,通过分类器如可以对这些特征进行分类。由于直接用提取到的特征进行分类可能会出现运算量过大以及过拟合的情况,为了对特征向量进行降维,减少特征图以及训练参数,可以采取池化处理。池化层的运算一般有以下几种:均值池化,最大值池化,髙斯池化以及可训练池化,其中后面两种不常用,实际用的比较多的是最大值池化。均值采样与最大值采样都可视为卷积过程。均值池化主要是将原图缩减成1/4。而最大值采样不仅将原图缩减成1/4,同时保持原图的最强输入。
|
||||
全连接层和一般的神经网络一样,最后一层隐含层与输出层进行全连接,将所有特征整合在一起,然后将输出值输送到分类器。
|
@ -0,0 +1,2 @@
|
||||
卷积神经网络的基本原理
|
||||
卷积神经网络是专门为二维图像设计的特殊网络结构,输入是一幅图像,输出是用于分类或者目标定位的图像特征。由于卷积神经网络的输入一般是一幅图片,如果利用普通的人工神经网络将图片的每个像素作为输入,此时一张图片中有多达百万级的像素点,这么多的输入会让网络非常复杂。借鉴人眼识别物体的局部感受原理,卷积神经网络也设计了一种感受野(卷积核)负责提取图片的局部特征,最后将多个局部特征综合得到图片的全局特征。卷积神经网络首先将输入图片利用多个随机初始化的卷积核(一般为奇数尺寸的小正方形)进行卷积运算(加权求和),然后将卷积运算的结果输入到激活函数得到多张特征图(该卷积核在特征图的提取过程中是权值共享的,这也是卷积神经网络的主要优点),最后对这些特征图进行下采样,这个过程迭代若干次之后将会得到整张图片的特征向量。
|
Loading…
Reference in new issue