深度学习-mnist手写体识别

mnist手写体识别

Mnist数据集可以从官网下载,网址: http://yann.lecun.com/exdb/mnist/ 下载下来的数据集被分成两部分:55000行的训练数据集(mnist.train)和10000行的测试数据集(mnist.test)。每一个MNIST数据单元有两部分组成:一张包含手写数字的图片和一个对应的标签。我们把这些图片设为“xs”,把这些标签设为“ys”。训练数据集和测试数据集都包含xs和ys,比如训练数据集的图片是 mnist.train.images ,训练数据集的标签是 mnist.train.labels。

我们可以知道图片是黑白图片,每一张图片包含28像素X28像素。我们把这个数组展开成一个向量,长度是 28x28 = 784。因此,在MNIST训练数据集中,mnist.train.images 是一个形状为 [60000, 784] 的张量。

MNIST中的每个图像都具有相应的标签,0到9之间的数字表示图像中绘制的数字。用的是one-hot编码

单层(全连接层)实现手写数字识别

1,定义数据占位符 特征值[None,784] 目标值[None,10]

with tf.variable_scope("data"):
    x = tf.placeholder(tf.float32,[None,784])
    y_true = tf.placeholder(tf.float32,[None,10])

2,建立模型 随机初始化权重和偏置,w[784,10],b= [10] y_predict = tf.matmul(x,w)+b

with tf.variable_scope("model"):
    w = tf.Variable(tf.random_normal([784,10],mean=0.0,stddev=1.0))
    b = tf.Variable(tf.constant(0.0,shape=[10]))
    y_predict = tf.matmul(x,w)+b

3,计算损失 loss 平均样本损失

with tf.variable_scope("compute_loss"):
    loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_true,logits=y_predict))

4,梯度下降优化 0.1 步数 2000 从而得出准确率

with tf.variable_scope("optimizer"):
    train_op = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

5,模型评估 argmax() reduce_mean

with tf.variable_scope("acc"):
    eq = tf.equal(tf.argmax(y_true, 1), tf.argmax(y_predict, 1))
    accuracy = tf.reduce_mean(tf.cast(eq,tf.float32))

加载mnist数据集

import tensorflow as tf
# 这里我们利用tensorflow给好的读取数据的方法
from tensorflow.examples.tutorials.mnist import input_data
def full_connected():
    # 加载mnist数据集
    mnist = input_data.read_data_sets("data/mnist/input_data",one_hot=True)

运行结果

accuracy: 0.08accuracy: 0.08accuracy: 0.1accuracy: 0.1accuracy: 0.1accuracy: 0.1accuracy: 0.1accuracy: 0.1accuracy: 0.14accuracy: 0.14accuracy: 0.16accuracy: 0.16accuracy: 0.18accuracy: 0.2accuracy: 0.2accuracy: 0.2accuracy: 0.24accuracy: 0.24accuracy: 0.24accuracy: 0.26accuracy: 0.26accuracy: 0.26accuracy: 0.28accuracy: 0.28accuracy: 0.3accuracy: 0.3accuracy: 0.32accuracy: 0.32accuracy: 0.32accuracy: 0.36accuracy: 0.4accuracy: 0.4accuracy: 0.4accuracy: 0.42accuracy: 0.44accuracy: 0.44accuracy: 0.44accuracy: 0.44accuracy: 0.44accuracy: 0.46accuracy: 0.46accuracy: 0.46accuracy: 0.46accuracy: 0.46accuracy: 0.48accuracy: 0.48accuracy: 0.48accuracy: 0.48accuracy: 0.48accuracy: 0.48accuracy: 0.52accuracy: 0.52accuracy: 0.54accuracy: 0.54accuracy: 0.54accuracy: 0.54accuracy: 0.56accuracy: 0.56accuracy: 0.56accuracy: 0.58accuracy: 0.6accuracy: 0.6accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.62accuracy: 0.64accuracy: 0.66accuracy: 0.66accuracy: 0.66accuracy: 0.66accuracy: 0.66accuracy: 0.66accuracy: 0.68accuracy: 0.7accuracy: 0.7accuracy: 0.7accuracy: 0.7accuracy: 0.72accuracy: 0.74accuracy: 0.76accuracy: 0.78accuracy: 0.78accuracy: 0.8accuracy: 0.8accuracy: 0.82accuracy: 0.82accuracy: 0.82accuracy: 0.84accuracy: 0.84accuracy: 0.84accuracy: 0.84Process finished with exit code 0

对于使用下面的式子当作损失函数不太理解的:

tf.nn.softmax_cross_entropy_with_logits

请看这篇随笔:https://www.cnblogs.com/TimVerion/p/11237087.html

原文地址:https://www.cnblogs.com/TimVerion/p/11237063.html

时间: 2024-07-30 21:32:44

深度学习-mnist手写体识别的相关文章

机器学习入门实践——线性回归&非线性回归&mnist手写体识别

把一本<白话深度学习与tensorflow>给啃完了,了解了一下基本的BP网络,CNN,RNN这些.感觉实际上算法本身不是特别的深奥难懂,最简单的BP网络基本上学完微积分和概率论就能搞懂,CNN引入的卷积,池化等也是数字图像处理中比较成熟的理论,RNN使用的数学工具相对而言比较高深一些,需要再深入消化消化,最近也在啃白皮书,争取从数学上把这些理论吃透 当然光学理论不太行,还是得要有一些实践的,下面是三个入门级别的,可以用来辅助对BP网络的理解 环境:win10 WSL ubuntu 18.04

【OCR技术系列之四】基于深度学习的文字识别(3755个汉字)

上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN,那具体使用哪个经典网络?VGG?RESNET?还是其他?我想了下,越深的网络训练得到的模型应该会更好,但是想到训练的难度以及以后线上部署时预测的速度,我觉得首先建立一个比较浅的网络(基于LeNet的改进)做基本的文字识别,然后再根据项目需求,再尝试其他的网络结构.这次任务所使用的深度学习框架是强大

一文全解:利用谷歌深度学习框架Tensorflow识别手写数字图片(初学者篇)

笔记整理者:王小草 笔记整理时间2017年2月24日 原文地址 http://blog.csdn.net/sinat_33761963/article/details/56837466?fps=1&locationNum=5 Tensorflow官方英文文档地址:https://www.tensorflow.org/get_started/mnist/beginners 本文整理时官方文档最近更新时间:2017年2月15日 1.案例背景 本文是跟着Tensorflow官方文档的第二篇教程–识别手

深度网络实现手写体识别

基于自动编码机(autoencoder),这里网络的层次结构为一个输入层,两个隐层,后面再跟着一个softmax分类器: 采用贪婪算法,首先把input和feature1看作一个自动编码机,训练出二者之间的参数,然后用feature1层的激活值作为输出,输入到feature2,即把feature1和feature2再看作一个自动编码机,训练出这两层之间的参数,这两步都没有用到分类标签,所以是无监督学习,最后把feature2的激活值作为提取的的特征,输入到分类器,这里需要标签来计算代价函数,从而

Tensorflow中使用CNN实现Mnist手写体识别

本文参考Yann LeCun的LeNet5经典架构,稍加ps得到下面适用于本手写识别的cnn结构,构造一个两层卷积神经网络,神经网络的结构如下图所示: 输入-卷积-pooling-卷积-pooling-全连接层-Dropout-Softmax输出 第一层卷积利用5*5的patch,32个卷积核,可以计算出32个特征.然后进行maxpooling.第二层卷积利用5*5的patch,64个卷积核,可以计算出64个特征.然后进行max pooling.卷积核的个数是我们自己设定,可以增加卷积核数目提高

pytorch实现MNIST手写体识别(全连接神经网络)

环境: pytorch1.1 cuda9.0 ubuntu16.04 该网络有3层,第一层input layer,有784个神经元(MNIST数据集是28*28的单通道图片,故有784个神经元).第二层为hidden_layer,设置为500个神经元.最后一层是输出层,有10个神经元(10分类任务).在第二层之后还有个ReLU函数,进行非线性变换. #!/usr/bin/env python # encoding: utf-8 ''' @author: liualex @contact: [em

MNIST数据集手写体识别(CNN实现)

github博客传送门 csdn博客传送门 本章所需知识: 没有基础的请观看深度学习系列视频 tensorflow Python基础 资料下载链接: 深度学习基础网络模型(mnist手写体识别数据集) MNIST数据集手写体识别(CNN实现) import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data # 导入下载数据集手写体 mnist = input_data.read

MNIST数据集手写体识别(MLP实现)

github博客传送门 csdn博客传送门 本章所需知识: 没有基础的请观看深度学习系列视频 tensorflow Python基础 资料下载链接: 深度学习基础网络模型(mnist手写体识别数据集) MNIST数据集手写体识别(MLP实现) import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data # 导入下载数据集手写体 mnist = input_data.read

MNIST数据集手写体识别(SEQ2SEQ实现)

github博客传送门 csdn博客传送门 本章所需知识: 没有基础的请观看深度学习系列视频 tensorflow Python基础 资料下载链接: 深度学习基础网络模型(mnist手写体识别数据集) MNIST数据集手写体识别(CNN实现) import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data # 导入下载数据集手写体 mnist = input_data.read