sklearn学习笔记（一）

简介

自2007年发布以来，scikit-learn已经成为Python重要的机器学习库了。scikit-learn简称sklearn，支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块。
sklearn是Scipy的扩展，建立在NumPy和matplotlib库的基础上。利用这几大模块的优势，可以大大提高机器学习的效率。
sklearn拥有着完善的文档，上手容易，具有着丰富的API，在学术界颇受欢迎。sklearn已经封装了大量的机器学习算法，包括LIBSVM和LIBINEAR。同时sklearn内置了大量数据集，节省了获取和整理数据集的时间。

机器学习基础

　　定义：针对经验E和一系列的任务T和一定表现的衡量P，如果随着经验E的积累，针对定义好的任务T可以提高表现P，就说明机器具有学习能力。

sklearn安装

sklearn目前的版本是0.17.1，可以使用pip安装。在安装时需要进行包依赖检查，具体有以下几个要求：

Python（>=2.6 or >=3.3）
NumPy(>=1.6.1)
SciPy(>=0.9)

如果满足上述条件，就能使用pip进行安装了：

1 pip install -U scikit-learn

当然，使用pip安装会比较麻烦，推荐使用Anaconda科学计算环境，里面已经内置了NumPy、SciPy、sklearn等模块，直接可用。或者使用conda进行包管理。conda安装与pip类似：

1  conda install scikit-learn

安装完sklearn以后，可以检查以下版本：

1  >>> import sklearn
2  >>> sklearn.__version__
3  ‘0.17.1‘

时间： 2024-11-03 21:16:42

sklearn学习笔记（一）的相关文章

Sklearn学习笔记

主要记python工具包sklearn的学习内容: 链接点击这里. 一.Regression 1.1. Generalized Linear Models 1.2. Linear and Quadratic Discriminant Analysis 1.3. Kernel ridge regression 二.Classification 三.Clustering 四.Dimensionality reduction 五.Model selection 六.Preprocessing

sklearn学习笔记之简单线性回归

简单线性回归线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项.线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误差项之后,方程的解法就存在了改变,一般使用最小二乘法进行计算. 使用sklearn.linear_model.LinearRegression进行线性回归 sklearn对Data Mining的各类算法已经有了较好的封装,基本可以使用fit.predict.score来训练.评价模型,并使用模型进

sklearn学习笔记2

Text classifcation with Na?ve Bayes In this section we will try to classify newsgroup messages using a dataset that can be retrieved from within scikit-learn. This dataset consists of around 19,000 newsgroup messages from 20 different topics ranging

sklearn学习笔记1

Image recognition with Support Vector Machines #our dataset is provided within scikit-learn #let's start by importing and printing its description import sklearn as sk import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import fe

sklearn学习笔记3

Explaining Titanic hypothesis with decision trees decision trees are very simple yet powerful supervised learning methods, which constructs a decision tree model, which will be used to make predictions. The main advantage of this model is that a huma

sklearn学习笔记之开始

简介 ??自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了.scikit-learn简称sklearn,支持包括分类.回归.降维和聚类四大机器学习算法.还包含了特征提取.数据处理和模型评估三大模块.??sklearn是Scipy的扩展,建立在NumPy和matplotlib库的基础上.利用这几大模块的优势,可以大大提高机器学习的效率.??sklearn拥有着完善的文档,上手容易,具有着丰富的API,在学术界颇受欢迎.sklearn已经封装了大量的机器学习算法,

线性回归学习笔记

操作系统 : CentOS7.3.1611_x64 python版本:2.7.5 sklearn版本:0.18.2 tensorflow版本 :1.2.1 线性回归是利用数理统计中回归分析, 来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法, 运用十分广泛. 其表达形式为y = w'x+e,e为误差服从均值为0的正态分布. 根据变量个数的多少可以分为一元线性回归和多元线性回归. 回归模型中, 一元回归是最简单且稳健的, 但描述复杂系统的行为时往往乏力, 因此基于多元回归的预测技术更

多项式回归学习笔记

操作系统 : CentOS7.3.1611_x64 python版本:2.7.5 sklearn版本:0.18.2 tensorflow版本 :1.2.1 多项式的定义及展现形式多项式(Polynomial)是代数学中的基础概念,是由称为不定元的变量和称为系数的常数通过有限次加减法.乘法以及自然数幂次的乘方运算得到的代数表达式. 多项式分为一元多项式和多元多项式,其中: 不定元只有一个的多项式称为一元多项式: 不定元不止一个的多项式称为多元多项式. 本文讨论的是一元多项式相关问题. 其一般形式

Query意图分析：记一次完整的机器学习过程（scikit learn library学习笔记）

所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质. 学习任务(一个二分类问题): 区分一个普通的互联网检索Query是否具有某个垂直领域的意图.假设现在有一个O2O领域的垂直搜索引擎,专门为用户提供团购.优惠券的检索:同时存在一个通用的搜索引擎,比如百度,通用搜索引擎希望能够识别出一个Query是否具有O2O检索意图,如果有则调用O2O垂直搜索引擎,获取结果作为通用搜索引擎的结果补充. 我们的目的是学习出一个分类器(classifier),分类器可以理解为一个函数,

猜你喜欢

android中多次点击事件的实现

1.在android系统中,设置里面->关于手机->安卓版本(即android version),三击后会出现android该个版本的版本号,以及一些动图,算是一个彩蛋吧! 2.导入set ...

MAC下查看端口占用并杀死进程

Eclipse在Run on Server时,Tomcat是开启的,但是报错,显示8080.8005和8009端口被占用终端输入查看所有开启的端口 sudo lsof -i -P | grep - ...

vertical-align属性

定义和用法: vertical-align 属性设置元素的垂直对齐方式. 浏览器支持: 所有浏览器都支持 vertical-align 属性. 注释:任何的版本的 Internet Explorer ...

一个怂女婿的成长笔记【十五】

2014-08-16 大部分人不是没有选择生活方式的权利,而是没有勇气去做出改变罢了. 我们经常在抱怨现在的生活不是自己想要的,但是当我们自问什么生活才是自己想要的时候,我们又偏偏答不出来,或者觉得太 ...

OpenCV原理解读之HAAR+Adaboost

由于在做人脸检测的项目,用到了OpenCV的训练结果中的老分类器,因此将旧分类器的检测方法进行了总结,加上了一些自己的理解,并转载了一些较好的文章记录下来. 文章http://www.61ic.com ...

从计数器到分频电路

本文介绍常见的电路——计数器,然后我们由计数器电路讲解到分频电路. 一.计数器 (1)计数器代码计数器,顾名思义就是在时钟的节拍下进行计数,一个简单的N位计数器的代码如下所示,这个计数器从0计数到2 ...

IO操作工具类

package com.imooc.io; import java.io.BufferedInputStream; import java.io.BufferedOutputStream; impor ...

关系型数据库和多维数据库的区别

Question: 初步理解多维数据库和关系型数据库都是表存储,只不过是在多维数据集里叫做事实表.维表,做分析的话关系型数据库也可以做到的呀?(书上说多维数据库的查询速度更快一点,可是为什么会更快呢? ...

自动化运维利器---pssh

有的公司,机房有60台服务器,有的公司机房有3000台服务器,还有的更多!这么多的服务器,要执行相同的系统配置操作,怎么办? 答案1: 一台一台的部署,有点活活累死的感觉! 答案2: 写SHEL ...

flex blazeds地址

BlazeDS地址:http://sourceforge.net/adobe/blazeds/wiki/Home/最新BlazeDS版本是2011年编译的4.0.1.21287版本,其中的spring ...

Spring Boot 入门

一.简介 Spring 官方网站本身使用Spring 框架开发,随着功能以及业务逻辑的日益复杂,应用伴随着大量的XML配置文件以及复杂的Bean依赖关系. 随着Spring 3.0的发布,Spring ...

【JAVA】心得分享（一）之初次安装体验

笔者本是一枚4年工作经验的.net程序猿,由于公司架构的改造,再加上行情.net的不争气(开始学.net的初衷是想着背靠微软总没错,俗话说的好,大树底下好乘凉.可现在培训班里几乎都没这个语言了,没落了 ...

Docker在CentOS7中的安装与启动

Docker是当下很流行的应用容器,在系统快速部署方面有着独特的优势.由于最近在做的一个项目需要用到Docker,所以找了些资料学了学.Docker不仅仅在应用快速部署方面有着独特的优势,而且在资源共 ...

A Knight's Journey POJ - 2488

Background The knight is getting bored of seeing the same black and white squares again and again an ...

Pow(x,n) leetcode java

题目: Implement pow(x, n). 题解: pow(x,n)就是求x的n次方.x的N次方可以看做:x^n = x^(n/2)*x^(n/2)*x^(n%2).所以利用递归求解,当n==1 ...

WebApi初探之路由配置

本文介绍了ASP.NET Web API路由HTTP请求控制器. 如果你熟悉ASP.NET MVC,Web API路由是和MVC路由非常相似的.主要差别是Web API使用HTTP方法而不是URI路径 ...

HIVE删除表数据

HIVE只有INSERT,没有UPDATE跟DELETE,所以通过其他的语句产生DETELE效果. 在HDFS上或者本地服务器上新建空的文件XXXXX, 然后执行: LOAD DATA LOCAL I ...

sub3 开发 NodeJS 项目-节1

本节对对工具 sublime Text3 的安装进行简介. 主要参考网址:http://blog.csdn.net/sam976/article/details/52076271(转载并修改) 1.介 ...

【转】测试思想-测试设计精简测试用例编写

大家都知道,测试用例的一个核心作用就覆盖测试需求,尽可能的减少漏测,同时提高测试效率.再细想想,这种核心作用的本质也就是一种“提醒”作用. 你可能会说“对呀,本来就是这样的呀,没啥问题呀”.我也觉得这 ...

nginx有时候图片下载或者500错误问题原因

有时候通过nginx的方式去访问url,会出现500错误,或者导致下载的图片不完整. 有可能是因为nginx的配置不对,查看nginx的log会发现没有权限访问proxy_temp. 首先确认工作进程 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.