j简单的分类实现-K近邻

1 __author__ = ‘worfzyq‘
2 from numpy import *
3 import operator
4
5 def creatDataset() :
6     group=array([[1.0,1.1],[1.0,1.0],[0.0,0.0],[0,0.1]])
7     labels=[‘A‘,‘A‘,‘B‘,‘B‘]
8     return group,labels
9
10 def classify0(inX,dataSet,labels,k) :
11     dataSetSize=dataSet.shape[0]  #返回数组得到维数
12     # print(dataSetSize)
13     diffMat=tile(inX,(dataSetSize,1))-dataSet  #把inX扩展datasetSize-1维然后做减法
14     #print(diffMat)
15     sqDiffMat=diffMat**2  #乘方
16     #print(sqDiffMat)
17     sqDistances=sqDiffMat.sum(axis=1) #把每一列加起来
18     #print(sqDistances)
19     distances=sqDistances**0.5   # 得到距离
20     sortedDistIndicies=distances.argsort() #得到排好序得到下标
21     classCount={}
22     for i in range(k) :
23         voteIlabel=labels[sortedDistIndicies[i]]
24         classCount[voteIlabel]=classCount.get(voteIlabel,0)+1
25     sortedClassCount=sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)
26     #print(sortedClassCount)
27     return sortedClassCount[0][0]
28
29 group,labels=creatDataset()
30 # print(group)
31 print(classify0([0,0],group,labels,3))

时间： 2024-08-08 09:26:17

j简单的分类实现-K近邻的相关文章

04_有监督学习--分类模型--K 近邻（kNN）

有监督学习--分类模型--K 近邻(kNN)0.引入依赖1.数据的加载和预处理2.核心算法实现3.测试4.自动化测试有监督学习--分类模型--K 近邻(kNN) 0.引入依赖 import numpy as np # 数值计算.矩阵运算.向量运算import pandas as pd # 数值分析.科学计算 # 这里直接引入 sklearn 里的数据集 --> iris 鸢尾花from sklearn.datasets import load_irisfrom sklearn.model_se

机器学习(四) 机器学习(四) 分类算法--K近邻算法 KNN (下)

六.网格搜索与 K 邻近算法中更多的超参数七.数据归一化 Feature Scaling 解决方案:将所有的数据映射到同一尺度八.scikit-learn 中的 Scaler preprocessing.py import numpy as np class StandardScaler: def __init__(self): self.mean_ = None self.scale_ = None def fit(self, X): """根据训练数据集X获得数据的均

最基础的分类算法-k近邻算法 kNN简介及Jupyter基础实现及Python实现

k-Nearest Neighbors简介对于该图来说,x轴对应的是肿瘤的大小,y轴对应的是时间,蓝色样本表示恶性肿瘤,红色样本表示良性肿瘤,我们先假设k=3,这个k先不考虑怎么得到,先假设这个k是通过程序员经验得到. 假设此时来了一个新的样本绿色,我们需要预测该样本的数据是良性还是恶性肿瘤.我们从训练样本中选择k=3个离新绿色样本最近的样本,以选取的样本点自己的结果进行投票,如图投票结果为蓝色:红色=3:0,所以预测绿色样本可能也是恶性肿瘤. 再比如此时来了一个新样本,我们选取离该样本最近

02-16 k近邻算法

[TOC] 更新.更全的<机器学习>的更新网站,更有python.go.数据结构与算法.爬虫.人工智能教学等着你:https://www.cnblogs.com/nickchen121/ k近邻算法 k近邻算法(k-nearest neighbors,KNN)是一种基本的分类和回归方法,本文只探讨分类问题中的k近邻算法,回归问题通常是得出最近的$k$个实例的标记值,然后取这$k$实例标记值的平均数或中位数. k近邻算法经常被人们应用于生活当中,比如傅玄曾说过"近朱者赤近墨者黑&quo

机器学习算法系列（1）：K近邻

一.K近邻算法 K近邻算法简单.直观.首先给出一张图,根据这张图来理解最近邻分类器. 根据上图所示,有两类不同的样本数据,分别用蓝色的小正方形和红色的小三角形表示,而图正中间的那个绿色的圆所标示的数据则是待分类的数据.也就是说,现在,我们不知道中间那个绿色的数据是从属于哪一类(蓝色小正方形或者红色小三角形),下面,我们就要解决这个问题:给这个绿色的圆分类. 我们常说,物以类聚,人以群分,判别一个人是一个什么样的人,常常可以从他身边的朋友入手,所谓观其友,而识其人.我们不是要判别上图中那个绿色的圆

k近邻算法理论（一）

时间 :2014.07.05 地点:基地 ----------------------------------------------------------------------------------- 一.简述 K近邻法(k-nearest neighbor,kNN)是一种基本分类与回归方法.k近邻的输入为实例的特征向量,对应特征空间中的点,输出为实例的类别.k近邻算法的基本思想是:给定训练数据集,实例类别已定,在对目标实例进行分类时,我们根据与目标实例k个最近邻居的训练实例的类别,通过

K近邻分类法

K近邻法 K近邻法:假定存在已标记的训练数据集,分类时对新的实例根据其K个最近邻的训练实例的类别,通过多数表决等分类决策规则进行预测. k近邻不具有显示学习的过程,是“懒惰学习”(lazy learning).分类器不需要使用训练集进行训练.实际上是利用训练数据集对特征向量空间进行划分,并作为其分类的“模型”. (标注:Lazy learning懒惰学习:训练阶段仅仅把样本保存起来,无训练时间开销,收到测试样本再进行处理: Eager laarning急切学习:训练阶段就对样本学习处理的方法.)

每日一个机器学习算法——k近邻分类

K近邻很简单. 简而言之,对于未知类的样本,按照某种计算距离找出它在训练集中的k个最近邻,如果k个近邻中多数样本属于哪个类别,就将它判决为那一个类别. 由于采用k投票机制,所以能够减小噪声的影响. 由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合. 一个不足之处是计算量较大,因为对每一个待分类的样本都要计算它到全体已知样本的距离,才能求得它的K个最近邻点.

基本分类方法——KNN(K近邻)算法

在这篇文章 http://www.cnblogs.com/charlesblc/p/6193867.html 讲SVM的过程中,提到了KNN算法.有点熟悉,上网一查,居然就是K近邻算法,机器学习的入门算法. 参考内容如下:http://www.cnblogs.com/charlesblc/p/6193867.html 1.kNN算法又称为k近邻分类(k-nearest neighbor classification)算法. 最简单平凡的分类器也许是那种死记硬背式的分类器,记住所有的训练数据,对于

猜你喜欢

Maven的国内镜像(解决jar下载过慢)

Maven简介 maven作为一个项目管理工具确实非常好用,结果在使用时候,你会发现下载jar速度不如自己在网上下载.之前oschina的中央仓库可用,现在oschina的maven服务器关了,只能拿 ...

C++__单向链表（练习）

单向链表 link.h #ifndef LINK_H_ #define LINK_H_ #define HEADER 0 #define TAIL -1 typedef int data_type; ...

Power of Two

Given an integer, write a function to determine if it is a power of two. 2的幂数二进制只有一个1 1 bool isPower ...

Methods and systems to control virtual machines

Methods and systems are provided to control the execution of a virtual machine (VM). A VM Monitor (V ...

计算1的个数

__int64 CountOne(__int64 n) { __int64 count =0; if (n ==0) count =0; else if (n >1&& n &l ...

int 3就是我们常说的软件断点,问题是,在什么时候我们需要用到int 3呢? 我们经常会碰到这样一种场景,有时候一个软件会由多个EXE组成,其中的某些EXE是由另外的EXE调用的,这时候我们通常调用 ...

java 8 中lambda表达式学习

转自 http://blog.csdn.net/renfufei/article/details/24600507 http://www.jdon.com/idea/java/10-example-o ...

IIS_ISAPI_Rewrite3(破解)伪静态

虽然win2003+iis6这个组合弱爆了,但是还是有不少人在用在此分享一下这个组合下9.0rc伪静态成功经验伪静态是一个站建站之初就要考虑的问题,如果搞不定就会成为一个拦路虎,因为这个规则一旦定下来 ...

hdu 4293 区间DP

1 /* 2 题目大意:n个人分成若干组,每个人都描叙他们组前面有多少人后面有多少人, 3 求说真话的人最多有多少个. 4 解题思路:把同一组的人数统计起来他们组前面有x人后面有y人, 5 num[x ...

来仿一仿retrofit

为什么要重复造轮子在开发领域有一句很流行的话就是不要重复造轮子, 因为我们在开发中用到的很多东西早已有很多人去实现了, 而且这些实现都是经过时间和开发者检验过的, 一般不会遇到什么坑, 而如果我们自 ...

数据库常用知识点

最近在写一些接口,总结一下目前想到的一些需要注意的点,说的并不是sqlserver与其他数据库语句的区别,只是想到了就写下来了,老规矩之后想到了在添加进去 null null在数据库中表示没有对这列数 ...

Linux下安装jdk-6u45-linux-x64.bin

最近在学习linux下java开发,在搭环境的过程中发现网上很多配置都是错误的,现在写出来,供参考: 从Oracle上下载jdk-6u45-linux-x64.bin 1.下载文件:jdk-6u45- ...

后互联网创业时代

这篇文章写给谁? 这篇文章其实是写给自己看的,毕竟我也没有什么粉丝嘛.互联网的创业浪潮如今此起彼伏,大街小巷随便一个人都可以和你聊两句互联网,充满干劲的80后以及90后都在拥入互联网的怀抱.对于像我这 ...

用户三次登陆密码错误锁定

import sys count = 0 name_list = [] while count < 3: name = input("请输入用户名:") lock_file ...

iOS动画Animation-4-1:CALayer

首先说明:这是一系列文章,参考本专题下其他的文章有助于你对本文的理解. 一.CALayer简介 CALayer作为动画主要的依托对象,想要深入的了解动画,必须先理解CALayer.CALayer包含在 ...

安卓接口请求实例

首先一个工具类 package com.luo.utils; import java.io.IOException; import java.io.InputStream; import java.i ...

搭建邮件服务器如何选择服务器

在选择服务器的时候,一般IDC运营商都会提出几种建议:购买VPS(虚拟专用服务器).购买服务器后托管到IDC机房.直接跟IDC运营商租用服务器或者选择购买云服务器. 然而,对于这么多选择,很多客户往往 ...

全局忽略编译警告

msvc编译器从2010 sp1开始就已经支持UTF-8的源码文件了(未考证,因为我自己用的是msvc2013,反正是可以支持UTF-8的) 但是在编译时仍然会出现4819的警告网上搜了下答案,都说 ...

java -- getOutputStream() has already been called for

原文:https://my.oschina.net/zhongwenhao/blog/209653 原因:既调用了response.getOutputStream(),又调用了response.get ...

opencv_python安装与配置_windows

0_安装python2.7.x python.org官网下载python2.7 1_numpy下载1.9.1 http://sourceforge.net/projects/numpy/files/N ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.018 s.