Python机器学习实战<三>:k-邻近算法

安装说明参考openssl源码文件夹下INSTALL.W32

step1

环境搭建

安装perl,Visual Studio 2008

下载Openssl最新版源码.我下的版本为OpenSSL-1.0.0g.

step2

启动Visual Studio 2008 Command Prompt

运行bin\vcvars32
设置
环境变量

注意:

如遇反馈"此处不应该有/Microsoft",参考错误1.

step3

VS命令行窗口cd至openssl源码文件夹

执行以下命令

$perlconfigure VC-WIN32

结果反馈
Configured for VC-WIN32.

注意:

如果想要调试,生成debug版本执行以下命令

$perlconfigure debug-VC-WIN32

step4

ms\do_ms.bat

ms文件夹下生成 nt.mak以及ntdll.mak.如果使用静态库,就编译nt.mak,如果使用动态库,就编译ntdll.mak

以nt.mak为例

step5

编译

$nmake -f ms\nt.mak

注意:

清除编译

$nmake -f ms\nt.mak clean

测试库

$nmake -f ms\nt.mak test

如遇错误:

NMAKE : fatal errorU1077: ‘"C:\Program Files (x86)\Microsoft Visual Studio 9.0\

VC\bin\cl.EXE"‘: return code ‘0xc0000135‘

参考错误2

如遇错误类似于无法打开某个文件:

d:\openssl-1.0.1g\crypto\cryptlib.h(62): fatal error C1083: Cannot open include

file: ‘stdlib.h‘: No such file or directory

参考错误3

step6

安装

$nmake -f ms\nt.mak install

安装到该磁盘分区 usr/local/ssl

使用openssl

include添加$(ssl_DIR)\include

library添加$(ssl_DIR)\lib

错误1

运行vcvars32.bat,提示此处不应该有/Microsoft,导致环境变量配置失败。

解决方案

环境变量路径去掉双引号

错误2

NMAKE : fatal errorU1077: ‘"C:\Program Files (x86)\Microsoft Visual Studio 9.0\

VC\bin\cl.EXE"‘: return code ‘0xc0000135‘

直接执行cl,弹出系统错误对话框,提示缺少mspdb80.dll。

解决方案:添加mspdb80.dll所在路径。

错误3

d:\openssl-1.0.1g\crypto\cryptlib.h(62): fatal error C1083: Cannot open include

file: ‘stdlib.h‘: No such file or directory

解决方案

运行vcvars32命令设置环境变量

or

$setINCLUDE=$(DIR);%INCLUDE%

or

CFLAG添加

/I$(DIR)

参考链接

The#include Directive

Python机器学习实战<三>:k-邻近算法,布布扣,bubuko.com

时间: 2024-11-03 21:36:22

Python机器学习实战<三>:k-邻近算法的相关文章

机器学习实战笔记-K近邻算法2(改进约会网站的配对效果)

案例二.:使用K-近邻算法改进约会网站的配对效果 案例分析: 海伦收集的数据集有三类特征,分别是每年获得的飞行常客里程数.玩视频游戏所耗时间百分比. 每周消费的冰淇淋公升数.我们需要将新数据的每个新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签.一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数.最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类. 流程:在约会网站上使用K

《机器学习实战》-k近邻算法

目录 K-近邻算法 k-近邻算法概述 解析和导入数据 使用 Python 导入数据 实施 kNN 分类算法 测试分类器 使用 k-近邻算法改进约会网站的配对效果 收集数据 准备数据:使用 Python 解析文本文件 分析数据:使用 Matplotlib 画二维散点图 准备数据:归一化数值 测试算法:验证分类器 使用算法:构建完整可用系统 手写识别系统 准备数据 测试算法 使用算法:构建完整可用系统 总结 K-近邻算法 k-近邻分类算法概述 使用 k-近邻算法改进约会网站的配对效果 手写识别系统

机器学习实战笔记--k近邻算法

1 #encoding:utf-8 2 from numpy import * 3 import operator 4 import matplotlib 5 import matplotlib.pyplot as plt 6 7 from os import listdir 8 9 def makePhoto(returnMat,classLabelVector): #创建散点图 10 fig = plt.figure() 11 ax = fig.add_subplot(111) #例如参数为

机器学习实战笔记-K近邻算法1(分类动作片与爱情片)

K近邻算法采用测量不同特征值之间的距离方法进行分类 K近邻算法特点: 优点:精度高.对异常值不敏感.无数据输入假定. 缺点:计算复杂度高.空间复杂度高. 适用数据范围:数值型和标称型. K近邻算法原理: 存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系.输人没有标签的新数据后,将新数据的每个特征与样本集中数据对应的 特征进行比较,然后算法提取样本集中特征最相似数据(最近 邻)的分类标签.一般来说,我们只选择样本数据集中前k个最

机器学习实战笔记-K近邻算法3(手写识别系统)

1 准备数据:将图像转换为测试向量 这次数据集还是有两种,训练数据集和测试数据集,分别有2000个,900个. 我们将把一个32*32的二进制图像矩阵转换为1 x 1024的向量,这样前两节使用的分类器就可以处理数字图像信息了. 代码: def img2vector(filename): returnVect = zeros((1,1024)) file = open(filename) for i in range(32): line = file.readline() for j in ra

《机器学习实战》——K近邻算法

原理: (1) 输入点A,输入已知分类的数据集data (2) 求A与数据集中每个点的距离,归一化,并排序,选择距离最近的前K个点 (3) K个点进行投票,票数最多的分类即为所求 优点: 简单,可用于非线性分类 缺点: 当样本不均衡时影响投票结果: 分类结果受K值影响: 时空复杂度高:需要保存全部数据O(N),每次取前k个都要与全部数据进行计算O(N),耗费内存大且计算量大 改进: 样本均衡化 太小的K值容易受噪音影响,大的K值减小噪音但会使分类边界模糊,最合适的方法是用交叉验证确定K值:先确定

《机器学习实战》学习笔记一K邻近算法

 一. K邻近算法思想:存在一个样本数据集合,称为训练样本集,并且每个数据都存在标签,即我们知道样本集中每一数据(这里的数据是一组数据,可以是n维向量)与所属分类的对应关系.输入没有标签的新数据后,将新数据的每个特征(向量的每个元素)与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似的的分类标签.由于样本集可以很大,我们选取前k个最相似数据,然后统计k个数据中出现频率最高的标签为新数据的标签. K邻近算法的一般流程: (1)收集数据:可以是本地数据,也可以从网页抓取. (2)准备数

python机器学习实战(三)

python机器学习实战(三) 版权声明:本文为博主原创文章,转载请指明转载地址 www.cnblogs.com/fydeblog/p/7277205.html  前言 这篇博客是关于机器学习中基于概率论的分类方法--朴素贝叶斯,内容包括朴素贝叶斯分类器,垃圾邮件的分类,解析RSS源数据以及用朴素贝叶斯来分析不同地区的态度. 操作系统:ubuntu14.04 运行环境:anaconda-python2.7-jupyter notebook 参考书籍:机器学习实战和源码,机器学习(周志华) not

python机器学习实战(四)

python机器学习实战(四) 版权声明:本文为博主原创文章,转载请指明转载地址 www.cnblogs.com/fydeblog/p/7364317.html 前言 这篇notebook是关于机器学习中logistic回归,内容包括基于logistic回归和sigmoid分类,基于最优化方法的最佳系数确定,从疝气病症预测病马的死亡率.操作系统:ubuntu14.04  运行环境:anaconda-python2.7-jupyter notebook 参考书籍:机器学习实战和源码   noteb