用 Python 做机器学习不得不收藏的重要库

Python通常被应用统计技术或者数据分析人员当做工作中的首选语言。数据科学家也会用python作为连接自身工作与WEB 应用程序/生产环境集成中。

Python在机器学习领域非常出色。它具有一致的语法、更短的开发时间和灵活性,非常适合开发能够直接插入生产系统的复杂模型和预测引擎。

Python的一个最大的资产是其广泛的库。

库是一组用给定语言编写的程序和功能的集合。一组健壮的库可以使开发人员更容易执行复杂的任务,而无需重写许多代码。

机器学习很大程度上是基于数学。具体来说就是数学优化、统计和概率。Python库帮助那些不具备开发人员知识的研究人员/数学家轻松地“进行机器学习”。

以下是机器学习中最常用的一些库:

Scikit-learn 经典的ML算法

Scikit-learn 是最流行的ML 库之一,他支持很多监督学习和非监督学习算法。例如:线性回归,逻辑回归,决策树,聚类 ,k-means等。

他基于两个python库:Numpy 和 Scipy 。 他为常见的机器学习和数据挖掘提供了一组算法:聚类,回归和分类。甚至像数据转换,特征选择,集成学习这样的任务也可与通过简短几行代码实现。

对于机器学习的新手来说,Scikit-learn 是一个够用的工具,直到你自己开始实现更复杂的算法。

Tensorflow for Deep Learning 深度学习

如果你在机器学习的世界里,你可能听过,尝试过或者实现过某种形式的深度学习的算法。但是他们是必要的吗?回答可能是不必要。但是完成他们后感觉很酷对吗? 回答是:对的!酷毙了。

Tensorflow 有趣的地方在于,当你使用python 编写代码,你可以编译和运行在你的CPU 或者GPU 上,而且你不需要写 c++或者 CUDA 的代码,就可以运行在GPUs 集群上。

他使用一个多层节点的系统,允许你快速的简历,训练,部署具有大量数据集的人工神经网络。这让谷歌能够识别照片中的物体,通过语音识别程序理解在口语中的单词。

Theano is also for Deep Learning

Theano 是另一个用于数值计算的优秀类库,有点类似于Numpy。Theano 允许你高效的定义,优化和评估涉及多维数组的数学表达式。

使Theano 与众不同的是它利用了计算机的GPU。这使得它能够比单独在CPU上运行时快100倍进行数据密集型计算。Theano的速度使得它对于深度学习和其他复杂的计算任务特别有价值。

Theano 库的最终发布是在去年——2017年,版本1.0.0包含了许多新特性、界面更改和改进。

Pandas 数据提取与预处理

panda是一个非常流行的库,它提供了简单易用且直观的高级数据结构。

它有许多内建的方法来分组、组合数据和过滤以及执行时间序列分析。

panda可以轻松地从SQL数据库、CSV、Excel、JSON文件等不同来源获取数据,并对数据进行操作。图书馆有两个主要结构:

  • Series“级数”---- 一维 。

  • Data Frames“数据帧”---- 二维。

如果想得知关于如何使用序列和数据看框架的更多细节,请查看的我的其他文章。

Matplotlib用于数据可视化

如果你不能很好的与其他人交流,那么最好的,最复杂的机器学习就显得没有意义。

那么如何从这些数据中转换出价值呢?你如何激励你的业务分析师,告诉他们充满“洞察力”的“故事”?

这就是Matplotlib发挥作用的地方。它是每个数据科学家用于创建2D图形和图形的标准Python库。它是命令行简单,这意味着它需要更多的命令来生成好看的图形和数字,而不是使用一些高级库。

然而,这也带来了灵活性。有了足够的命令,您可以使用Matplotlib制作任何您想要的图形。您可以构建不同的图表,从直方图和散点图到非笛卡尔坐标图。

它支持所有操作系统上的不同GUI后端,还可以将图形导出到通用矢量和图形格式,如PDF、SVG、JPG、PNG、BMP、GIF等。

Seaborn是另一个数据可视化库

Seaborn是一个流行的可视化库,它建立在Matplotlib的基础之上。它是一个高级库,这意味着更容易生成某些类型的图,包括热图、时间序列和小提琴图。

最后

这是机器学习中最重要的Python库的集合。如果您打算使用Python和数据科学,那么这些库是值得一看的,同时也值得您熟悉。

我是否错过了任何重要的Python ML库?如果是,请务必在下面的评论中提到它。尽管我试图介绍最有用的库,但可能仍然没有介绍其他一些值得研究的库。

问题或建议吗?我很想听听你的意见——请随意留言。

原文地址:https://www.cnblogs.com/chuangye95/p/10226091.html

时间: 2024-08-02 11:11:58

用 Python 做机器学习不得不收藏的重要库的相关文章

使用Python做机器学习的准备工作

机器学习的入门书籍<机器学习实战>使用的语言是python.下面介绍利用Python开始"机器学习"的准备工作.(环境:CentOS 7) 1, 两个重要的包 NumPy 和 SciPy.(http://scipy.org/scipylib/download.html )主要是处理数值运算,矩阵操作等. 注:Sci是Science的缩写. 官网介绍了安装方法,可以手动安装,也可以使用yum.(numpy 和 scipy  在默认的软件源有提供) 需要说明的是,scipy是依

半路出山想迅速上手Python做机器学习?这篇文章就是你需要的实用指南

毋庸置疑,近来机器学习人气日益高涨,逐渐在流行词榜单上占据一席之地.机器学习算法繁多,到底该选择哪一种处理相关数据是困扰很多学习者的问题.本文将以一种清晰简明的方式,解释并实践最常见的几种机器学习算法. 接下来,我们将罗列8种最常见火爆的机器学习算法,通过Python,将它们分别适用同一个经典数据集Iris(线性回归和逻辑回归除外),进而分辨出不同算法在预测准确率.模型建立过程.对数据集的使用方式等方向的异同.每一种算法后都将附上Python实现代码和演示视频. 推荐下我自己创建的Python学

从Python开始机器学习

目前机器学习红遍全球.男女老少都在学机器学习模型,分类器,神经网络和吴恩达.你也想成为一份子,但你该如何开始? 在这篇文章中我们会讲Python的重要特征和它适用于机器学习的原因,介绍一些重要的机器学习包,以及其他你可以获取更详细资源的地方. 加qq群813622576免费领取学习资料 为什么用Python做机器学习 Python很适合用于机器学习.首先,它很简单.如果你完全不熟悉Python但是有一些其他的编程经验(C或者其他编程语言),要上手是很快的.其次,Python的社区很强大.这使得P

用Python开始机器学习(7:逻辑回归分类) --好!!

from : http://blog.csdn.net/lsldd/article/details/41551797 在本系列文章中提到过用Python开始机器学习(3:数据拟合与广义线性回归)中提到过回归算法来进行数值预测.逻辑回归算法本质还是回归,只是其引入了逻辑函数来帮助其分类.实践发现,逻辑回归在文本分类领域表现的也很优秀.现在让我们来一探究竟. 1.逻辑函数 假设数据集有n个独立的特征,x1到xn为样本的n个特征.常规的回归算法的目标是拟合出一个多项式函数,使得预测值与真实值的误差最小

用Python开始机器学习(2:决策树分类算法)

http://blog.csdn.net/lsldd/article/details/41223147 从这一章开始进入正式的算法学习. 首先我们学习经典而有效的分类算法:决策树分类算法. 1.决策树算法 决策树用树形结构对样本的属性进行分类,是最直观的分类算法,而且也可以用于回归.不过对于一些特殊的逻辑分类会有困难.典型的如异或(XOR)逻辑,决策树并不擅长解决此类问题. 决策树的构建不是唯一的,遗憾的是最优决策树的构建属于NP问题.因此如何构建一棵好的决策树是研究的重点. J. Ross Q

机器学习00:如何通过Python入门机器学习

我们都知道机器学习是一门综合性极强的研究课题,对数学知识要求很高.因此,对于非学术研究专业的程序员,如果希望能入门机器学习,最好的方向还是从实践触发. 我了解到Python的生态对入门机器学习很有帮助.因此希望以此作为突破口入门机器学习. 我将会记录一个系列的学习与实践记录.记录内容主要参考Youtube中sentdex发布的视频,有兴趣的读者可以自己FQ到油管看一下. 下面介绍一下我将如何通过Python入门机器学习. 学习Python基本语法 首先我在Python官网找到入门教程,快速过了一

Python相关机器学习‘武器库’

开始学习Python,之后渐渐成为我学习工作中的第一辅助脚本语言,虽然开发语言是Java,但平时的很多文本数据处理任务都交给了Python.这些年来,接触和使用了很多Python工具包,特别是在文本处理,科学计算,机器学习和数据挖掘领域,有很多很多优秀的Python工具包可供使用,所以作为Pythoner,也是相当幸福的.如果仔细留意微博和论坛,你会发现很多这方面的分享,自己也Google了一下,发现也有同学总结了"Python机器学习库",不过总感觉缺少点什么.最近流行一个词,全栈工

python入门机器学习,3行代码搞定线性回归

本文着重是重新梳理一下线性回归的概念,至于几行代码实现,那个不重要,概念明确了,代码自然水到渠成. "机器学习"对于普通大众来说可能会比较陌生,但是"人工智能"这个词简直是太火了,即便是风云变化的股市中,只要是与人工智能.大数据.云计算相关的概念股票都会有很好的表现.机器学习是实现人工智能的基础,今天早上看了美国著名演员威尔斯密斯和世界最顶级的机器人进行对话的视频,视频中的机器人不论从语言还是表情都表达的非常到位,深感人工智能真的离我们越来越近了,所以学习人工智能前

8个用Python进行机器学习建模项目的实用建议,让新手小白精准避坑

很多伙伴是接触Python编程入门不久,我们用Python进行机器学习建模项目的时候,每个人都会有自己的一套项目文件管理的习惯,我也有一套方法,是曾经踩过的雷总结出来的,现在在这里分享一下给大家!也希望大家少走弯路! 目录先放出来 项目文件事先做好归档 永远不要手动修改源数据并且做好备份 做好路径的正确配置 代码必要的地方做好备注与说明 加速你的Python循环代码 可视化你的循环代码进度 使用高效的异常捕获工具 要多考虑代码健壮性 1. 项目文件事先做好归档 每次开始一个新工作的时候,以前的我