You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

302 lines
10 KiB

########手写数字数据集##########
###########保存模型############
########1层隐含层全连接层##########
#60000条训练数据和10000条测试数据28x28像素的灰度图像
#隐含层激活函数ReLU函数
#输出层激活函数softmax函数实现多分类
#损失函数:稀疏交叉熵损失函数
#输入层有784个节点隐含层有128个神经元输出层有10个节点
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np
import tkinter as tk
from tkinter import filedialog
import cv2
import utilsl
import numpy as np
import argparse
import imutils
from imutils import contours
import tensorflow as tf
import time
print('--------------')
nowtime = time.strftime('%Y-%m-%d %H:%M:%S')
print(nowtime)
#指定GPU
#import os
#os.environ["CUDA_VISIBLE_DEVICES"] = "0"
#gpus = tf.config.experimental.list_physical_devices('GPU')
#tf.config.experimental.set_memory_growth(gpus[0],True)
#初始化
plt.rcParams['font.sans-serif'] = ['SimHei']
#加载数据
mnist = tf.keras.datasets.mnist
(train_x,train_y),(test_x,test_y) = mnist.load_data()
print('\n train_x:%s, train_y:%s, test_x:%s, test_y:%s'%(train_x.shape,train_y.shape,test_x.shape,test_y.shape))
#数据预处理
#X_train = train_x.reshape((60000,28*28))
#Y_train = train_y.reshape((60000,28*28)) #后面采用tf.keras.layers.Flatten()改变数组形状
X_train,X_test = tf.cast(train_x/255.0,tf.float32),tf.cast(test_x/255.0,tf.float32) #归一化
y_train,y_test = tf.cast(train_y,tf.int16),tf.cast(test_y,tf.int16)
#建立模型
model = tf.keras.Sequential()
model.add(tf.keras.layers.Flatten(input_shape=(28,28))) #添加Flatten层说明输入数据的形状
model.add(tf.keras.layers.Dense(128,activation='relu')) #添加隐含层为全连接层128个节点relu激活函数
model.add(tf.keras.layers.Dense(10,activation='softmax')) #添加输出层为全连接层10个节点softmax激活函数
print('\n',model.summary()) #查看网络结构和参数信息
#配置模型训练方法
#adam算法参数采用keras默认的公开参数损失函数采用稀疏交叉熵损失函数准确率采用稀疏分类准确率函数
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['sparse_categorical_accuracy'])
#训练模型
#批量训练大小为64迭代5次测试集比例0.248000条训练集数据12000条测试集数据
print('--------------')
nowtime = time.strftime('%Y-%m-%d %H:%M:%S')
print('训练前时刻:'+str(nowtime))
history = model.fit(X_train,y_train,batch_size=64,epochs=5,validation_split=0.2)
print('--------------')
nowtime = time.strftime('%Y-%m-%d %H:%M:%S')
print('训练后时刻:'+str(nowtime))
#评估模型
model.evaluate(X_test,y_test,verbose=2) #每次迭代输出一条记录,来评价该模型是否有比较好的泛化能力
#保存模型参数
#model.save_weights('C:\\Users\\xuyansong\\Desktop\\深度学习\\python\\MNIST\\模型参数\\mnist_weights.h5')
#保存整个模型
model.save('mnist_weights.h5')
#结果可视化
print(history.history)
loss = history.history['loss'] #训练集损失
val_loss = history.history['val_loss'] #测试集损失
acc = history.history['sparse_categorical_accuracy'] #训练集准确率
val_acc = history.history['val_sparse_categorical_accuracy'] #测试集准确率
plt.figure(figsize=(10,3))
plt.subplot(121)
plt.plot(loss,color='b',label='train')
plt.plot(val_loss,color='r',label='test')
plt.ylabel('loss')
plt.legend()
plt.subplot(122)
plt.plot(acc,color='b',label='train')
plt.plot(val_acc,color='r',label='test')
plt.ylabel('Accuracy')
plt.legend()
#暂停5秒关闭画布否则画布一直打开的同时会持续占用GPU内存
#根据需要自行选择
#plt.ion() #打开交互式操作模式
#plt.show()
#plt.pause(5)
#plt.close()
#使用模型
#plt.figure()
#for i in range(10):
# num = np.random.randint(1,10000)
# plt.subplot(2,5,i+1)
# plt.axis('off')
# plt.imshow(test_x[num],cmap='gray')
# demo = tf.reshape(X_test[num],(1,28,28))
# y_pred = np.argmax(model.predict(demo))
# plt.title('标签值:'+str(test_y[num])+'\n预测值'+str(y_pred))
#y_pred = np.argmax(model.predict(X_test[0:5]),axis=1)
#print('X_test[0:5]: %s'%(X_test[0:5].shape))
#print('y_pred: %s'%(y_pred))
#plt.ion() #打开交互式操作模式
#plt.show()
#plt.pause(5)
#plt.close()
# 创建tkinter根窗口并立即隐藏
root = tk.Tk()
root.withdraw()
# 弹出文件选择对话框让用户选择模板文件
#template_file_path = filedialog.askopenfilename(title="选择模板文件", filetypes=[("PNG files", "*.png"), ("JPEG files", "*.jpg"), ("All files", "*.*")])
# 弹出文件选择对话框让用户选择信用卡图片
image_file_path = filedialog.askopenfilename(title="选择信用卡图片", filetypes=[("PNG files", "*.png"), ("JPEG files", "*.jpg"), ("All files", "*.*")])
# 使用用户选择的路径读取模板文件和信用卡图片
#img = cv2.imread(template_file_path)
image = cv2.imread(image_file_path)
#指定信用卡类型
FIRST_NUMBER={
"3":"American Express",
"4":"Visa",
"5":"MasterCard",
"6":"Discover Card"
}
#绘图展示
def cv_show(name,img):
cv2.imshow(name,img)
cv2.waitKey(0)
cv2.destroyAllWindows()
def preprocess_image(roi):
# 调整图像大小并归一化
roi = cv2.resize(roi, (28, 28))
roi = roi / 255.0
roi = roi.reshape(1, 28, 28, 1) # 为模型输入调整形状
return roi
def predict_digit(roi, model):
roi = preprocess_image(roi)
prediction = model.predict(roi)
digit = np.argmax(prediction)
return str(digit)
#读取一个模板文件
#img=cv2.imread(template_file_path)
#cv_show("img",img)
#灰度图
#ref=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
#cv_show('ref',ref)
#二值图像
#ref=cv2.threshold(ref,10,255,cv2.THRESH_BINARY_INV)[1]
#cv_show('ref',ref)
#model = tf.keras.models.load_model('mnist_weights.h5')
#计算轮廓
#cv2.findContours()函数接受的参数为二值图,即黑白的(不是灰度图)
#cv2.RETR_EXTERNAL只检测外轮廓cv2.CHAIN_APPROX_SIMPLE只保留终点坐标
#返回的list中每个元素都是图像中的一个轮廓
#refCnts,hierarchy=cv2.findContours(ref.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
#cv2.drawContours(img,refCnts,-1,(0,0,255),3)
#cv_show('img',img)
#refCnts=utilsl.sort_contours(refCnts,method="left-to-right")[0]#排序从左到右,从上到下
#digits={}
'''
第一个参数img是原图
第二个参数xy是矩阵的左上点坐标
第三个参数x+wy+h是矩阵的右下点坐标
第四个参数0,255,0是画线对应的rgb颜色
'''
#遍历每一个轮廓
#for(i,c) in enumerate(refCnts):
#计算外接矩形并且resize成合适大小
# (x,y,w,h)=cv2.boundingRect(c)
# roi=ref[y:y+h,x:x+w]
# roi=cv2.resize(roi,(57,58))
#每一个数字对应一个模板
# digits[i]=roi
#初始化卷积核
rectKernel=cv2.getStructuringElement(cv2.MORPH_RECT,(9,3))
sqKernel=cv2.getStructuringElement(cv2.MORPH_RECT,(5,5))
#读取输入图像,预处理
image=cv2.imread(image_file_path)
cv_show('image',image)
image=utilsl.resize(image,width=300)
gray=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv_show('gray',gray)
#礼帽操作,突出更明亮的区域
tophat=cv2.morphologyEx(gray,cv2.MORPH_TOPHAT,rectKernel)
cv_show('tophat',tophat)
#计算
gradX=cv2.Sobel(tophat,ddepth=cv2.CV_32F,dx=1,dy=0,ksize=1)
gradX=np.absolute(gradX)
(minVal,maxVal)=(np.min(gradX),np.max(gradX))
gradX=(255*((gradX-minVal)/(maxVal-minVal)))
gradX=gradX.astype("uint8")
print(np.array(gradX).shape)
cv_show('gradX',gradX)
#通过闭操作,(先膨胀,在腐蚀)将数字连在一起
gradX=cv2.morphologyEx(gradX,cv2.MORPH_CLOSE,rectKernel)
cv_show('gradX',gradX)
#THRESH_OTSU会自动寻找合适的阈值适合双峰需把阈值参数设置为0
thresh=cv2.threshold(gradX,0,255,cv2.THRESH_BINARY|cv2.THRESH_OTSU)[1]
cv_show('thresh',thresh)
#再来一个闭操作
thresh=cv2.morphologyEx(thresh,cv2.MORPH_CLOSE,sqKernel)
cv_show('thresh',thresh)
thresh=cv2.morphologyEx(thresh,cv2.MORPH_CLOSE,sqKernel)
cv_show('thresh',thresh)
#计算轮廓
threshCnts,hierarchy=cv2.findContours(thresh.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts=threshCnts
cur_img=image.copy()
cv2.drawContours(cur_img,cnts,-1,(0,0,255),3)
cv_show('img',cur_img)
locs=[]
#遍历轮廓
for (i,c) in enumerate(cnts):
#计算矩形
(x,y,w,h)=cv2.boundingRect(c)
ar=w/float(h)
#适合合适的区域,根据实际任务来,这里的基本是四个数字一组
if ar>2.5 and ar <4:
if(w>40 and w<55) and (h>10 and h<20):
#符合的留下来
locs.append((x,y,w,h))
#将符合的轮廓从左到右排序
locs=sorted(locs,key=lambda x:x[0])
output=[]
#遍历每一个轮廓中的数字
for (i,(gX,gY,gW,gH)) in enumerate(locs):
#initialize the list of group digits
groupOutput=[]
#根据坐标提取每一个组
group=gray[gY-5:gY+gH+5,gX-5:gX+gW+5]
cv_show('group',group)
#预处理
group=cv2.threshold(group,0,255,cv2.THRESH_BINARY|cv2.THRESH_OTSU)[1]
cv_show('group',group)
#计算每一个轮廓
digitCnts,hierarchy=cv2.findContours(group.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
digitCnts=contours.sort_contours(digitCnts,method="left-to-right")[0]
#计算每一组总的每一个数值
for c in digitCnts:
(x, y, w, h) = cv2.boundingRect(c)
roi = group[y:y + h, x:x + w]
roi = cv2.resize(roi, (28, 28))
cv_show('roi', roi)
digit = predict_digit(roi, model)
groupOutput.append(digit)
print("识别的数字:", groupOutput)
#画出来
cv2.rectangle(image,(gX-5,gY-5),(gX+gW+5,gY+gH+5),(0,0,255),1)
cv2.putText(image,"".join(groupOutput),(gX,gY-15),cv2.FONT_HERSHEY_SIMPLEX,0.65,(0,0,255),2)
#得到结果
output.extend(groupOutput)
# 打印结果
#print("Credit Card Type: {}".format(FIRST_NUMBER[output[0]]))
print("Credit Card #: {}".format("".join(output)))
cv2.imshow("Image", image)
cv2.waitKey()
cv2.destroyAllWindows()