xy 5 years ago
commit fc32be37c3

@ -0,0 +1,4 @@
字符识别原理及大致流程
首先对输入图片进行卷积提取图片的特征,每个卷积层中通常包含若干个卷积单元,每个神经元与前一层的部分图像相连接并作为当前的输入,然后卷积单元与这个局部图像进行卷积。一般情况下,卷积神经网络卷积层含有多个特征平面,每个特征平面含有一种卷积核,用来提取某一种特征,多个卷积核可以提取图片的多种特征,这样可以充分地对图片进行特征提取。
通过卷积层和输入图片进行卷积后,我们可以得到图片的特征信息,通过分类器如可以对这些特征进行分类。由于直接用提取到的特征进行分类可能会出现运算量过大以及过拟合的情况,为了对特征向量进行降维,减少特征图以及训练参数,可以采取池化处理。池化层的运算一般有以下几种:均值池化,最大值池化,髙斯池化以及可训练池化,其中后面两种不常用,实际用的比较多的是最大值池化。均值采样与最大值采样都可视为卷积过程。均值池化主要是将原图缩减成1/4。而最大值采样不仅将原图缩减成1/4,同时保持原图的最强输入。
全连接层和一般的神经网络一样,最后一层隐含层与输出层进行全连接,将所有特征整合在一起,然后将输出值输送到分类器。

@ -0,0 +1,2 @@
卷积神经网络的基本原理
卷积神经网络是专门为二维图像设计的特殊网络结构,输入是一幅图像,输出是用于分类或者目标定位的图像特征。由于卷积神经网络的输入一般是一幅图片,如果利用普通的人工神经网络将图片的每个像素作为输入,此时一张图片中有多达百万级的像素点,这么多的输入会让网络非常复杂。借鉴人眼识别物体的局部感受原理,卷积神经网络也设计了一种感受野(卷积核)负责提取图片的局部特征,最后将多个局部特征综合得到图片的全局特征。卷积神经网络首先将输入图片利用多个随机初始化的卷积核(一般为奇数尺寸的小正方形)进行卷积运算(加权求和),然后将卷积运算的结果输入到激活函数得到多张特征图(该卷积核在特征图的提取过程中是权值共享的,这也是卷积神经网络的主要优点),最后对这些特征图进行下采样,这个过程迭代若干次之后将会得到整张图片的特征向量。

@ -0,0 +1,4 @@
卷积神经网络的结构
卷积神经网络是一种多层的监督学习神经网络隐含层的卷积层和池采样层是实现卷积神经网络特征提取功能的核心模块。该网络模型通过采用梯度下降法最小化损失函数对网络中的权重参数逐层反向调节通过频繁的迭代训练提高网络的精度。卷积神经网络的低隐层是由卷积层和最大池采样层交替组成高层是全连接层对应传统多层感知器的隐含层和逻辑回归分类器。第一个全连接层的输入是由卷积层和子采样层进行特征提取得到的特征图像。最后一层输出层是一个分类器可以采用逻辑回归Softmax回归甚至是支持向量机对输入图像进行分类。
卷积神经网络结构包括:卷积层,降采样层,全链接层。每一层有多个特征图,每个特征图通过一种卷积滤波器提取输入的一种特征,每个特征图有多个神经元。卷积层主要用于提取输入图片的特征,池化层主要是将卷积层提取到了特征区域取平均值或是最大值来降维,全连接层是将所有的图片的局部特征组合成全局特征。卷积层是卷积神经网络的核心层。池化层一般在连续的卷积层中间,用于降低数据冗余和避免过拟合。全连接层主要用于特征降维以便后续分类器或者回归器更好的工作。
输入图像统计和滤波器进行卷积之后提取该局部特征一旦该局部特征被提取出来之后它与其他特征的位置关系也随之确定下来了每个神经元的输入和前一层的局部感受野相连每个特征提取层都紧跟一个用来求局部平均与二次提取的计算层也叫特征映射层网络的每个计算层由多个特征映射平面组成平面上所有的神经元的权重相等。通常将输入层到隐藏层的映射称为一个特征映射也就是通过卷积层得到特征提取层经过pooling之后得到特征映射层。
Loading…
Cancel
Save