机器学习:手写数字数据集

手写数字数据集（下载地址：http://www.cs.nyu.edu/~roweis/data.html）

　　手写数字数据集包括1797个0-9的手写数字数据，每个数字由8*8大小的矩阵构成，矩阵中值的范围是0-16，代表颜色的深度。
　　使用sklearn.datasets.load_digits即可加载相关数据集。

参数：
* return_X_y：若为True ,则以（data, target）形式返回数据；默认为False，表示以字典形式返回数据全部信息（包括data和target）。
* n_class：表示返回数据的类别数，如：n_class = 5, 则返回0到4的数据样本。

加载数据：

>>> from sklearn.datasets import load_digits
>>> digits = load_digits()
>>> print(digits.data.shape)
>>> print(digits.target.shape)
>>> print(digits.images.shape)

>>> import matplotlib.pyplot as plt
>>> plt.matshow(digits.images[0])
>>> plt.show()

输出：

(1797L, 64L)
(1797L,)
(1797L, 8L, 8L)

（未完待续）

时间： 2024-10-03 23:28:48

机器学习:手写数字数据集的相关文章

在Kaggle手写数字数据集上使用Spark MLlib的朴素贝叶斯模型进行手写数字识别

昨天我在Kaggle上下载了一份用于手写数字识别的数据集,想通过最近学习到的一些方法来训练一个模型进行手写数字识别.这些数据集是从28×28像素大小的手写数字灰度图像中得来,其中训练数据第一个元素是具体的手写数字,剩下的784个元素是手写数字灰度图像每个像素的灰度值,范围为[0,255],测试数据则没有训练数据中的第一个元素,只包含784个灰度值.现在我打算使用Spark MLlib中提供的朴素贝叶斯算法来训练模型. 首先来设定Spark上下文的一些参数: val conf = new Spar

基于MNIST手写数字数据集的数字识别小程序

30行代码奉上!(MNIST手写数字的识别,识别率大约在91%,简单尝试的一个程序,小玩具而已) 1 import tensorflow.examples.tutorials.mnist.input_data as input_data 2 import tensorflow as tf 3 mnist = input_data.read_data_sets('/temp/', one_hot=True) 4 5 #设置 6 x = tf.placeholder(tf.float32,[None

在Kaggle手写数字数据集上使用Spark MLlib的RandomForest进行手写数字识别

昨天我使用Spark MLlib的朴素贝叶斯进行手写数字识别,准确率在0.83左右,今天使用了RandomForest来训练模型,并进行了参数调优. 首先来说说RandomForest 训练分类器时使用到的一些参数: numTrees:随机森林中树的数目.增大这个数值可以减小预测的方差,提高预测试验的准确性,训练时间会线性地随之增长. maxDepth:随机森林中每棵树的深度.增加这个值可以是模型更具表征性和更强大,然而训练也更耗时,更容易过拟合. 在这次的训练过程中,我就是反复调整上面两个参数

MNIST手写数字数据集

下载python源代码之后,使用: import input_data mnist = input_data.read_data_sets('MNIST_data/',one_hot=True) 下载下来的数据集分成: mnist.train.images 60000*784 mnist.train.labels 60000*10 mnist.test.images 60000*784 mnist.test.labels 60000*10 原文地址:https://www.cnblogs.com

【转】机器学习教程十四-利用tensorflow做手写数字识别

模式识别领域应用机器学习的场景非常多,手写识别就是其中一种,最简单的数字识别是一个多类分类问题,我们借这个多类分类问题来介绍一下google最新开源的tensorflow框架,后面深度学习的内容都会基于tensorflow来介绍和演示请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址什么是tensorflow tensor意思是张量,flow是流. 张量原本是力学里的术语,表示弹性介质中各点应力状态.在数学中,张量表示的是一种广义的"数量",0阶张量

Python 手写数字识别-knn算法应用

在上一篇博文中,我们对KNN算法思想及流程有了初步的了解,KNN是采用测量不同特征值之间的距离方法进行分类,也就是说对于每个样本数据,需要和训练集中的所有数据进行欧氏距离计算.这里简述KNN算法的特点: 优点:精度高,对异常值不敏感,无数据输入假定缺点:计算复杂度高,空间复杂度高适用数据范围:数值型和标称型(具有有穷多个不同值,值之间无序) knn算法代码: #-*- coding: utf-8 -*- from numpy import * import operatorimport

TensorFlow实战之Softmax Regression识别手写数字

关于本文说明,本人原博客地址位于http://blog.csdn.net/qq_37608890,本文来自笔者于2018年02月21日 23:10:04所撰写内容(http://blog.csdn.net/qq_37608890/article/details/79343860). 本文根据最近学习TensorFlow书籍网络文章的情况,特将一些学习心得做了总结,详情如下.如有不当之处,请各位大拿多多指点,在此谢过. 一.相关概念 1.MNIST MNIST(Mixed

利用手写数字识别项目详细描述BP深度神经网络的权重学习

本篇文章是针对学习<深度学习入门>(由日本学者斋藤康毅所著陆羽杰所译)中关于神经网络的学习一章来总结归纳一些收获. 本书提出神经网络的学习分四步:1.mini-batch 2.计算梯度 3.更新参数 4.重复前面步骤 1.从识别手写数字项目学习神经网络所谓“从数据中学习”是指可以由数据#自动决定权重#.当解决较为简单的问题,使用简单的神经网络时,网络里的权重可以人为的手动设置,去提取输入信息中特定的特征.但是在实际的神经网络中,参数往往是成千上万,甚至可能上亿的权重,这个时候人为手动设置是

神经网络手写数字识别

聊了几天理论,是该弄一个 Hello World 了,在人工智能领域,或者说深度学习领域,Hello World 程序就是手写数字识别,今天我们就来看看手写数字识别的程序怎么写.不愿意看代码吗,那我就说一说这段代码干了点什么:先通过 keras 内置的数据集下载测试数据,是 60000 长手写图片的训练集和 10000 张测试集,随后定义了一个神经网络的模型,设置网络中的层参数,随后配置训练网络的参数,包括损失函数和评测模型,设置迭代次数,启动训练网络,最后将测试数据喂给网络,得出训练效果是否有

猜你喜欢

SpringMVC中简单的上传

项目截图需要导入的基本包有Spring所有的包加上Apache支持上传的包 web.xml <?xml version="1.0" encoding="UTF-8 ...

android OkHttpUtils 使用JSON数据作为请求参数

如果就直接将JSON作为请求字符串,服务端会出现中文乱码.所以只需要将请求的整个JSON参数字符串编码一次,然后服务端解码一次.我这里服务端使用的servlet,下面会两段代码贴出. android: ...

Linux新手入门书籍推荐鸟哥的linux私房菜-基础学习篇

这本书写的不错.赞~\(≧▽≦)/~ 2017-02-24 下午,我开始在Linux下写第一个.c程序,在终端打印hello world.gcc 源代码文件之后,输出可执行文件,但是当我输入文件名执 ...

SQL数据库基础知识-巩固篇<一>

SQL数据库基础知识-巩固篇<一>... 首先展示两款我个人很喜欢的数据库-专用于平时个人SQL技术的练习<特点:体积小,好安装和好卸载,功能完全够用了> MySQL-57 D ...

2017090-构建之法：现代软件工程-阅读笔记

现代软件工程软件 = 程序 + 软件工程程序 = 数据结构 + 算法软件工程包括了开发,运营,软件维护的过程中的很多技术.做法.习惯和思想.软件工程把这些相关的技术和过程统一到一个体系中,叫&q ...

Lightoj 1025 - The Specials Menu

区间dp /* *********************************************** Author :guanjun Created Time :2016/6/30 23:2 ...

jboss 5.1 启动问题解决

在安装好后启动时可能遇到这样的情况: ERROR [AbstractKernelController] Error installing to Instantiated: name=Attachmen ...

响应式布局开头篇

第一步:流式布局实例======> <style type="text/css"> *{ margin: 0; padding: 0; } div{ float ...

Spark修炼之道（进阶篇）——Spark入门到精通：第十三节 Spark Streaming—— Spark SQL、DataFrame与Spark Streaming

主要内容 Spark SQL.DataFrame与Spark Streaming 1. Spark SQL.DataFrame与Spark Streaming 源码直接参照:https://githu ...

centos7重置root密码

1 - 在启动grub菜单,选择编辑选项启动 2 - 按键盘e键,来进入编辑界面 3 - 找到Linux 16的那一行,将ro改为rw init=/sysroot/bin/sh 4 - 现在按下 Co ...

oracle数据的启动

打开实例 , 数据库到nomount状态: startup nomount; 参数文件内存,进程指定控制文件数据库打开到mount状态: alter datatbase mount; 控制文件 ...

软件工程概论总结

软件工程概论课程总结经过一个学期的学习,软件工程概论这门课在第十七周结束了,经过一学期的学习,这门课给了我很大的帮助,让我收获了很多,比如说学会了Java web技术,JavaScript,连接my ...

用户登录三次锁定

实现功能输入三次错误密码后自动锁定,判断用户是否存在和是否已经锁定(中文用户会报错需要进一步改进) #!/usr/bin/env python # _*_ coding:utf-8 _*_ # 文件名 ...

js处理json js递归

1 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncodin ...

监视网络接口TCP状态信息数据有多种工具或命令。下面举例一些：

nstat命令 nstat kernel ======= ss -s == netstat -i netstat -s ip -s link sar -n DEV 1

简单工厂模式（详细）（举例饮料）

饮料案例: 饮料类(父类): public class Drink { //虚方法 public virtual void Driking() { ...

企业规范化管理之计划管理——制订计划的五个要诀

凡事预则立,不预则废.良好的计划是成功的一半.计划很重要,是人都知道,问题是愿意订工作计划的人不多,知道如何订计划的人很少,订了计划坚持做到的更是少之又少. 企业工作计划通常分为年度计划.月度计划.周 ...

c语言中，有符号数位移

#include <stdio.h> int main(void) { unsigned i = 0xcffffff3; long j=0xcffffff3; int k=0xcfffff ...

Hibernate createCriteria查询详解

本文转载自 : http://penghao122.javaeye.com/blog/80794 1.创建一个Criteria实例 net.sf.hibernate.Criteria这个接口代表对一个 ...

html利用锚点实现定位代码实例

html利用锚点实现定位代码实例: 本章节介绍介绍一下如何利用锚点实现定位,使用锚点实现定位是html固有的功能,当然比较简单,也实现了基本的功能,但是功能相对简单一些,如果想要实现平滑的定位可以参阅 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.