scikit-learn 和pandas 基于windows单机机器学习环境的搭建

    很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。

Step 1. Python的安装

    python有2.x和3.x的版本之分,但是很多好的机器学习python库都不支持3.x,因此,推荐安装2.7版本的python。当前最新的python是2.7.12.链接如下:

    https://www.python.org/downloads/release/python-2712/

    里面可以看到有32位版和64位版的。如果你的机器是64位版的,那么32位和64位版的任选一个安装就可以了。如果机器是32位版的,就只能安装32位版的了。如果你搞不清楚你的机器的位数,那么就安装32位版的吧。也就是“Windows x86 MSI installer”。

Windows x86-64 MSI installer Windows for AMD64/EM64T/x64, not Itanium processors 8fa13925db87638aa472a3e794ca4ee3 19820544 SIG
Windows x86 MSI installer Windows   fe0ef5b8fd02722f32f7284324934f9d 18907136 SIG

    安装完毕后,可以设置下环境变量,把python目录加到PATH,比如我的Python装在 C:\Python27,那我就把C:\Python27\Scripts和C:\Python27加到环境变量。当然不加也可以。这样每次使用Python时加上python的全路径名。

    安装完成后,在windows的命令行输入python,如果能出来python的基本信息说明安装成功。

Step 2. Python包管理工具pip的安装

    我们需要包管理工具来方便python库的安装,包管理工具有很多,这里推荐我习惯使用的pip。

    下载pip的安装脚本。链接如下。下载get-pip.py。然后到你的下载目录,在命令行输入"python get-pip.py",跑完即可安装成功。

    https://pip.pypa.io/en/stable/installing/

    下载完毕后,记得跑下这个命令“pip install -U pip”,一是看看pip能不能正常工作,二是把pip升级到最新版本。

Step 3. 安装 Visual C++ Compiler for Python

    链接在这: https://www.microsoft.com/en-us/download/details.aspx?id=44266

    这个不装后面很多科学计算的都会装不了。

Step 4. 安装numpy和scipy

    这两哥们是科学计算和矩阵运算必备工具。

    由于numpy和scipy直接用pip安装经常会出各种各样的问题,因此一般推荐下载离线版的whl来安装numpy和scipy。

    首先安装离线版的numpy,这里我一般是在下面的链接下载numpy,当然scipy也是在这。

    http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy

    可以看到里面有很多版本的numpy可以下载,我们的python是2.7,windows 32位的,因此下载“numpy-1.11.2+mkl-cp27-cp27m-win32.whl

    下载完毕后进入下载目录,在命令行运行 "pip install numpy-1.11.2+mkl-cp27-cp27m-win32.whl" ,这样numpy就安装成功了。

    用同样的方法安装scipy。在下面的链接下载scipy。

    http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

    我们的python是2.7,windows 32位的,因此选择scipy-0.18.1-cp27-cp27m-win32.whl下载。

    完了运行 "pip install scipy-0.18.1-cp27-cp27m-win32.whl"

    这样numpy和scipy两个好基友就搞定了。

Step 4. 安装matplotlib,pandas和scikit-learn

    这没有什么好说的,直接在命令行运行下面的命令即可。注意,先安装matplotlib再安装pandas

    pip install -U matplotlib

     

    pip install -U jinja2

    pip install -U jsonschema

    pip install -U pyzmq

    pip install -U pandas

    pip install -U scikit-learn

Step 5. 安装ipython和ipython notebook

    ipython notebook是最常用的python交互式学习工具,当然,现在叫做Jupyter Notebook。scikit-learn官方的例子都给出了用ipython notebook运行的版本。

    安装方式很简单:

    pip install ipython

    pip install jupyter

    官网在这:http://ipython.org/notebook.html

    安装完毕后,在命令行输入“jupyter-notebook”,输出会提示你notebook运行在http://localhost:8888

Step 6.  Hello World!尝试运行一个scikit-learn机器学习程序

    在scikit-learn官网下载一个机器学习的例子,比如: http://scikit-learn.org/stable/_downloads/plot_cv_predict.ipynb

    然后在下载目录运行"jupyter notebook",接着浏览器打开http://localhost:8888

    可以在浏览器看到你下载目录的内容,我们打开刚下载的plot_cv_predict.ipynb这个文件链接,可以看到python程序的内容,这时我们可以点上面的三角形按钮,一步步的运行程序,如果没有报错,最后可以看到一个线性回归的预测图。

    可以修改这个程序,重新一步步的跑,达到研究学习的目的。

    以上就是scikit-learn和pandas环境的搭建过程。希望大家都可以搭建成功,来研究机器学习。

(欢迎转载,转载请注明出处。欢迎沟通交流: [email protected])

    

时间: 2024-10-25 17:11:00

scikit-learn 和pandas 基于windows单机机器学习环境的搭建的相关文章

Python与机器学习:windows下机器学习环境的搭建

我的电脑系统是win7 64 位 安装了python-2.7.12.msi 和python-3.4.2.amd64.msi, ========注意:========= 同时都配置好了环境变量path  配置哪个版本的环境就选择相应的配置 (两者不能同时存在,否则用不了pip或easy_install) ....;C:\Python27\Scripts;C:\Python27; 或C:\Python34\Scripts;C:\Python34;....... |------------------

Windows下UEFI环境的搭建

Windows下UEFI环境的搭建 一.环境准备 1. 安装2012及以上VS https://visualstudio.microsoft.com/ 2.下载NASM 2.13.03  http://www.nasm.us/,默认安装目录为C:\nasm,同时添加到PATH环境变量中 3. 安装Python2.7.x  https://www.python.org/,默认安装目录为C:\Python27,添加到新建的PYTHON_HOME环境变量中 4. 安装openssl http://wi

基于Windows Server 2012 R2 x64搭建Redmine

Highlight: 参考文档:http://www.redmine.org/projects/redmine/wiki/RedmineInstall mysql和redmine在同一台主机上,实际部署时可单独部署mysql. 本文不包括整合Apache/Nginx. 以下内容在virtualbox虚拟机上测试可行. OS环境 操作系统:Windows Server 2012 R2 x64 英文标准版(MSDN下载ISO) 安装完系统后,安装以下patch,这些patch都可以从微软官方网站下载

Windows下Python环境的搭建

我刚开始接触Python没多久,当然这也是为初学者来更好的去入门Python,我电脑上既跑着Windows也跑着Red Hat的Linux,相比较而言,开发我还是更青睐于Linux系统,很多开发工具红帽公司都给提供了. 那么这里我们先说一下Linux下的Python,Linux下Red Hat在光盘里集成了很多套的开发工具,当我们在安装Linux之前选择安装系统类型的时候我们选择GUI,然后把相应的开发工具勾选上就好啦,我当时勾选上了开发工具,现在电脑上既有JDK,也由于GCC,也有Python

Windows平台kafka环境的搭建

注意:Kafka的运行依赖于Zookeeper,所以在运行Kafka之前我们需要安装并运行Zookeeper 下载安装文件: http://kafka.apache.org/downloads.html 1 解压文件(本文解压到 D:\kafka_2.9.2-0.8.2.2) 2 打开D:\kafka_2.9.2-0.8.2.2\config\ server.properties 3 把 log.dirs的值改成 log.dirs=D:\data\logs\kafka 4 D:\kafka_2.

windows下android环境的搭建:完成后添加android其他版本

JDK: jdk-6u10-rc2-bin-b32-windows-i586-p-12_sep_2008.exe Eclipse:Eclipse3.7.1 Android sdk:android-sdk_r20.0.3-windows 按照网上的安装方法,安装完成后的android sdk 界面 现在我成功的安装了两个版本,但是其它的版本不能安装 解决办法:修改host 在host 文件后面加上一句这个:74.125.237.1 dl-ssl.google.com 就行了 文章转自:http:/

Python之扩展包安装(scikit learn)

scikit learn 是Python下开源的机器学习包.(安装环境:win7.0 32bit和Python2.7) Python安装第三方扩展包较为方便的方法:easy_install + packages name 在官网 https://pypi.python.org/pypi/setuptools/#windows-simplified 下载名字为 的文件. 在命令行窗口运行 ,安装后,可在python2.7文件夹下生成Scripts文件夹.把路径D:\Python27\Scripts

基于Windows 机器学习(Machine Learning)的图像分类(Image classification)实现

原文:基于Windows 机器学习(Machine Learning)的图像分类(Image classification)实现 今天看到一篇文章  Google’s Image Classification Model is now Free to Learn  说是狗狗的机器学习速成课程(Machine Learning Crash Course)现在可以免费学习啦,因为一开始年初的时候是内部使用的,后来开放给大众了.大家有谁对不作恶家的机器学习感兴趣的话,可以点击连接去看看. 但是以上不是

Query意图分析:记一次完整的机器学习过程(scikit learn library学习笔记)

所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质. 学习任务(一个二分类问题): 区分一个普通的互联网检索Query是否具有某个垂直领域的意图.假设现在有一个O2O领域的垂直搜索引擎,专门为用户提供团购.优惠券的检索:同时存在一个通用的搜索引擎,比如百度,通用搜索引擎希望能够识别出一个Query是否具有O2O检索意图,如果有则调用O2O垂直搜索引擎,获取结果作为通用搜索引擎的结果补充. 我们的目的是学习出一个分类器(classifier),分类器可以理解为一个函数,