第四十七篇入门机器学习——分类的准确性（Accuracy）

No.1. 通常情况下，直接将训练得到的模型应用于真实环境中，可能会存在很多问题

No.2. 比较好的解决方法是，将原始数据中的大部分用于训练数据，而留出少部分数据用于测试，即，将数据集切分成训练数据集和测试数据集两部分，先通过训练数据集得到一个模型，然后通过测试数据集来检验模型的性能是否满足我们的要求，根据测试结果的好坏判断模型是否需要进行改进和优化

No.3. 我们通过鸢尾花数据集来测试kNN算法的分类准确性，首先是数据准备工作

No.4. 我们可以将上述过程封装到函数中

No.5. 调用我们封装的数据集切分函数

No.6. 调用自己封装的KNNClassifier类，测试其分类准确性

No.7. 调用scikit-learn中的数据集切分函数train_test_split

No.8. 接下来，我们再通过sklearn提供的手写数字数据集digits来测试一下kNN算法的分类准确性，首先是数据准备工作

No.9. 查看一下数据集的详细描述信息

从上面的描述信息中可以了解到，这个数据集共有5620个数据实例，每个实例有64个属性（特征），这64个属性实际组成了8x8像素的图片，每个像素点的取值范围是0-16，这个数据集共分为10个类别，即0-9这10个数字。另外需要注意的一点是，这个数据集只是原数据集的一个简化副本，它实际上只存储了不到2000个数据实例。

No.10. 我们具体查看一下数据集的特征

即，数据集共存储了1797个数据实例，每个实例都有64个特征

即，这1797个数据实例都有对应的标签，标签共分为10个类别，分别为0, 1, 2, 3, 4, 5, 6, 7, 8, 9

简单查看前100个数据实例对应的标签，发现这些数据并没有按照不同类别分类存放

简单查看前5个数据实例的具体数据信息，发现每个数据实例对应一个由64个数字构成的向量

随便选取一个数据实例进行可视化

No.11. 调用我们实现的数据切分函数对数据集进行切分，再调用我们是实现的KNNClassifier类，测试其分类准确性

No.12. 上面在测试分类准确性的时候，计算准确性的过程还没有进行封装，我们将其封装如下：

测试一下封装好的函数：

No.13. 某些情况下，我们对预测值具体是什么并不感兴趣，我们可能只想知道我们模型预测结果的准确性，这种情况下，是没有必要手动计算一遍预测值的，我们可以封装一个接口，直接获取到模型预测结果的准确性，在kNNClassifier类中添加一个方法实现这个功能：

测试一下这个接口：

No.14. 调用sklearn提供的数据切分函数对数据集进行切分，再调用sklearn提供的KNeighborsClassifier类，测试其分类准确性

原文地址：https://www.cnblogs.com/xuezou/p/9332632.html

时间： 2024-10-07 04:10:42

第四十七篇入门机器学习——分类的准确性（Accuracy）的相关文章

第四十九篇入门机器学习——数据归一化（Feature Scaling）

No.1. 数据归一化的目的数据归一化的目的,就是将数据的所有特征都映射到同一尺度上,这样可以避免由于量纲的不同使数据的某些特征形成主导作用. No.2. 数据归一化的方法数据归一化的方法主要有两种:最值归一化和均值方差归一化. 最值归一化的计算公式如下: 最值归一化的特点是,可以将所有数据都映射到0-1之间,它适用于数据分布有明显边界的情况,容易受到异常值(outlier)的影响,异常值会造成数据的整体偏斜. 均值方差归一化的计算公式如下: 均值方差归一化的特点是,可以将数据归一化到均值为

Python之路(第四十七篇) 协程

一.协程介绍协程:是单线程下的并发,又称微线程,纤程.英文名Coroutine.一句话说明什么是线程:协程是一种用户态的轻量级线程,即协程是由用户程序自己控制调度的. 协程相比于线程,最大的区别在于,协程不需要像线程那样来回的中断切换,也不需要线程的锁机制,因为线程中断或者锁机制都会对性能问题造成影响,所以协程的性能相比于线程,性能有明显的提高,尤其在线程越多的时候,优势越明显. 协程的好处: 无需线程上下文切换的开销无需原子操作锁定及同步的开销 "原子操作(atomic operation

一步一步入门机器学习之五：机器学习自学指南

事实上有许多的途径可以了解机器学习,也有许多的资源例如书籍.公开课等可为所用,一些相关的比赛和工具也是你了解这个领域的好帮手.本文我将围绕这个话题,给出一些总结性的认识,并为你由程序员到机器学习高手的蜕变旅程中提供一些学习指引. 机器学习的四个层次根据能力可以将学习过程分成四个阶段.这也是一个有助于我们将所有学习资源进行分类的好方法. 初学阶段新手阶段中级阶段高级阶段我之所以把初学阶段和新手阶段区分开来,是因为我想让那些完全初学者(对这个领域感兴趣的程序员)在初学阶段对机器学习有一个大

NeHe OpenGL教程第四十七课：CG顶点脚本

转自[翻译]NeHe OpenGL 教程前言声明,此 NeHe OpenGL教程系列文章由51博客yarin翻译(2010-08-19),本博客为转载并稍加整理与修改.对NeHe的OpenGL管线教程的编写,以及yarn的翻译整理表示感谢. NeHe OpenGL第四十七课:CG顶点脚本 CG 顶点脚本 nVidio的面向GPU的C语言,如果你相信它就好好学学吧,同样这里也只是个入门.记住,类似的语言还有微软的HLSL,OpenGL的GLSL,ATI的shaderMonker.不要选错哦:)

简单粗暴地入门机器学习

有很多小伙伴问过我零基础要怎么入门机器学习或者人工智能,今天来提炼一下,方便志同道合的朋友们参考. 记得我刚入此山洞准备修炼的时候,就 Google 了好多这类的问题,那时候觉得大家的建议好多呀,这条路看起来真长,那么多东西要学,那么多书要看,那么多有用的课程要学. 现在我可以就自己走过的坑坑包包来推荐一条简单粗暴的路径. ［step 1: 方向］在行动之前,先想好这几个最基本的问题,如果自己想不全都可以去搜一下,知乎上很多大拿的回答: --1.为什么要学习机器学习或者人工智能呢? 我的话,很

微信公众平台开发教程（四）实例入门：机器人(附源码)

微信公众平台开发教程(四) 实例入门:机器人(附源码) 上一篇文章,写了基本框架,可能很多人会觉得晕头转向,这里提供一个简单的例子来予以说明,希望能帮你解开谜团. 一.功能介绍通过微信公众平台实现在线客服机器人功能.主要的功能包括:简单对话.查询天气等服务. 这里只是提供比较简单的功能,重在通过此实例来说明公众平台的具体研发过程.只是一个简单DEMO,如果需要的话可以在此基础上进行扩展. 当然后续我们还会推出比较复杂的应用实例. 二.具体实现 1.提供访问接口这里不再赘述,参照上一章,微信公

Python开发【第十七篇】：MySQL（一）

Python开发[第十七篇]:MySQL(一) 一.概述 1.什么是数据库 ? 答:数据的仓库,如:在ATM的示例中我们创建了一个 db 目录,称其为数据库 2.什么是 MySQL.Oracle.SQLite.Access.MS SQL Server等 ? 答:他们均是一个软件,都有两个主要的功能: a. 将数据保存到文件或内存 b. 接收特定的命令,然后对文件进行相应的操作 PS:如果有了以上软件,无须自己再去创建文件和文件夹,而是直接传递命令给上述软件,让其来进行文件操作,他们统称为数据

机器学习00：如何通过Python入门机器学习

我们都知道机器学习是一门综合性极强的研究课题,对数学知识要求很高.因此,对于非学术研究专业的程序员,如果希望能入门机器学习,最好的方向还是从实践触发. 我了解到Python的生态对入门机器学习很有帮助.因此希望以此作为突破口入门机器学习. 我将会记录一个系列的学习与实践记录.记录内容主要参考Youtube中sentdex发布的视频,有兴趣的读者可以自己FQ到油管看一下. 下面介绍一下我将如何通过Python入门机器学习. 学习Python基本语法首先我在Python官网找到入门教程,快速过了一

Python3入门机器学习经典算法与应用

详情请交流 QQ 709639943 00.Python3入门机器学习经典算法与应用 00.老司机学python篇:第一季(基础速过.机器学习入门) 00.Python 从入门到精通 78节.2000多分钟.36小时的高质量.精品.1080P高清视频教程!包括标准库.socket网络编程.多线程.多进程和协程. 00.Django实战之用户认证系统 00.Django实战之企业级博客 00.深入浅出Netty源码剖析 00.NIO+Netty5各种RPC架构实战演练 00.JMeter 深

猜你喜欢

web系统中ACL, RBAC等鉴权系统的异同

ACL, 强调面向资源, 描述对具体资源对象的操作鉴权, 有诸如Zend_ACL(好用), symfony-acl(不好用)等实现应用场景如:对一条帖子资源的增删改鉴权, 整个鉴权流程中, 权限部分 ...

批量创建用户

[ 1:用户批量打印 echo stu{01..10} |xarge -n 1 echo stu{1..10 } |tr " " "\n" 2: echo s ...

C# 值类型与引用类型

值类型在栈中分配内存空间并保存数据: 引用类型在堆上分配内存空间并保存数据,且在栈中保存指向堆中的数据地址: 值类型变量声明后,不管是否已经赋值,编译器为其分配内存. 引用类型当声明一个类时,只在栈中 ...

python2.x学习小记

不定时更新,不一定适合3.X,但一定适合2.7. 一.Python中的装饰器 def main(): def decorator_with_params(arg_of_decorator): prin ...

mysql 时间字段的函数 timestamp

Mysql 里格式时间字段的函数 DATE_FORMAT unix_timestamp - 墨墨修行的日志 - 网易博客http://jjuanxi.blog.163.com/blog/static ...

XML 解析

XML 解析 // 1. 开始文档 - 准备工作 - (void)parserDidStartDocument:(NSXMLParser *)parser { NSLog(@"1. 开始文档 ...

企业QQ客服的添加

商城项目需要用腾讯的企业QQ客服,但默认提供的是一个链接,点击后弹出一个新页面, 请确认确认打开QQ与营销QQ4009928310对话? 点确认才弹出聊天窗口,并不是需求想要的效果,经过一番折腾联系 ...

VS2010报错无法编译：LINK : fatal error LNK1123: failure during conversion to COFF: file invalid

win7 64位专业版 + vs2010 从vc6.0下转过来的一个项目,突然遇到这个问题. 解决方案: 用C:\Windows\winsxs\x86_netfx-cvtres_for_vc_and ...

关于CoreData和SQLite多线程访问时的线程安全问题

http://www.jianshu.com/p/95db3fc4deb3 关于CoreData和SQLite多线程访问时的线程安全问题数据库读取操作一般都是多线程访问的.在对数据进行读取时,我们要 ...

NOIP2007矩阵取数[DP｜高精度]

题目描述帅帅经常跟同学玩一个矩阵取数游戏:对于一个给定的n*m的矩阵,矩阵中的每个元素aij均为非负整数.游戏规则如下: 1.每次取数时须从每行各取走一个元素,共n个.m次后取完矩阵所有元素: 2. ...

互联网服务端技术——如何学（下C）

老王又在周日的下午来骚扰你了,今天给你带来的应该是这个系列的最后一篇~ 前面该铺垫的都做的差不多了(如果没看过老王之前的文章,请打开微信关注:simplemain),今天给大家聊聊很现实的.距离大家平 ...

jboss7.1.1相关error及解决办法

问题1: 报错提示: 公司的网站系统使用的中间是jboss7.1.1 Final,由于有些数据和服务测试环境不具备,免不了要在测试环境调试些jsp页面,发现从jboss社区里下载的jboss应用有个问 ...

studio

Studio可以在: http://www.androiddevtools.cn/进行下载在第一次需要FQ软件下载支持https://pan.baidu.com/s/1cEffBo 快捷键的修改:在 ...

老男孩linux决心书

通过2016年3月份至10月份的努力学习,我要努力提升自己在linux方面的能力.目标是要在明年达到月薪16k. 每次作业都在B+以上,为了达到如下目标,我将付出如下行动: 1丶少玩游戏,尽量不打lo ...

shell中调用mysql 原格式输出到文件里面

sql5="select * from 表名 ;"; 第一种方法 #ss1=$(mysql -u $DB_USER -h ${DB_IP} -p${DB_PASSWD} $DB_N ...

谈微服务架构（转）

时间 2016-03-22 11:38:33 人月神话的BLOG 原文 http://blog.sina.com.cn/s/blog_493a84550102w5x6.html 主题微服务其实 ...

如何使用记事本学习？

------------会持续地修改和添加内容------------ 熊谷正寿把记事本分为梦想.行动和思考三类.梦想记事本列出目标,行动记事本保证实施,而思考记事本则确定方向.接下来我将以记事本为基 ...

unicode and utf-8

今晚听同事分享提到这个,简单总结下. Unicode字符集 Unicode的出现是因为ASCII等其他编码码不够用了,比如ASCII是英语为母语的人发明的,只要一个字节8位就能够表示26个英文字母了, ...

tableViewCell的分割线短一截的问题

最近在写很简单的tableView的布局时,发现系统自带的Cell分割线短了15像素,不过这个可以更改,纯代码方式如下: //设置分割线到头,不再断15像素 if ([self.tableView r ...

cglib的简单案例

本文的例子全部来自github上cglib的官方文档,有关cglib的教程少之又少,如果想学习觉得还是看看诸如Hibernate和Spring的源码来的实在. package com.tang; im ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.