Alexander的Python机器学习 之目录分析。

无聊,顺应一下潮流,学习一下python机器学习吧。

买了一本书,首先分析一下目录吧。

1.第一章是 Python机器学习的生态系统。

  1.1.数据科学或机器学习的工作流程。

    然后又分成6点进行详细说明:获取,检查和探索,清理和准备,建模,评估,部署。

  1.2.讲解了Python库和相应的功能。

    这里也分成5个点进行详细说明:获取,检查,准备,建模和评估,部署。

  1.3.设置机器学习的环境。

  1.4.最后来一个总结。

2.第二章就来一个案例吧,构建应用程序,来挖掘低价的公寓。

  2.1.首先来获取公寓房源的数据吧。这里将使用import.io方法来抓取房源数据。

  2.2.然后就是检查和准备数据呢。分为两个点,首先分析数据,然后就是可视化数据。

  2.3.然后就是对数据进行建模。这里又分为两个点,首先是预测,然后就是扩展模型。

  2.4.最后来一个总结吧。

3.第三章来一个机票的案例吧,同样来挖掘一下低价的机票。

  3.1.首先肯定是要获取机票价格数据嘛。

  3.2.这里是一个学习点:使用高级的网络爬虫技术来检索票价数据。

  3.3.获取到数据之后就是解析了,这里通过聚类技术来识别一个异常的票价,也是一个学习点。

  3.4.然后就是意义所在之处了,通过使用IFTTT来发送实时提醒,这个就可以为人民服务了吧。

  3.5.学习了这些分散的知识点,通过这个项目简单整合一下吧。

  3.6.最后来一个总结吧。这个总结性价比极高的哟。

4.来点厉害的,使用逻辑回归来预测IPO市场,IPO市场就类似炒股了。

  4.1.首先介绍一下什么是IPO,这个不用说了,就是一些有商业头脑的人通过公众来投资公司攒大钱。

  4.2.讲解特征工程,这个厉害了。

  4.3.然后讲解二元分类,貌似很高大上呢。

  4.4.分析一下特征的重要性,同样也是预测IPO市场的重要部分吧。

  4.5.最后来个小结。

5.创建自定义的新闻源,这个我喜欢。

  5.1.使用Pocket应用程序,来创建一个监督训练的集合。原来训练就是这个意思,之前公司老是听到那些牛人说什么训练训练的。

  5.2.第二步就是获取到数据源了,这里使用embed.ly的API来下载故事的内容。

  5.3.然后就是讲解自然语言的一些处理基础了,这个是个难点。

  5.4.然后就是讲解如何使用向量机,这个同样非常关键,对于训练是非常有必要的。

  5.5.然后就是讲解IFTTT与文章源,Google表达和电子邮件的集成,这里涉及的概念有点多。

  5.6.然后就是根据自己爱好,设置每日个性化的简报,就是得出结果了吧。

  5.7.最后来一个小结吧。

6.来点有意思的东西,预测你的内容是否会广为流传。这个意思就是你火了。

  6.1.讲解了一个病毒的案例,说明它是怎么火的。

  6.2.统计火的程度,即获取分享的数量和内容。

  6.3.探索是怎么火起来的,即探索传播性的特征。

  6.4.然后就是构建一个自己的内容的预测模型,看看会不会火。

  6.5.最后来一个小结吧。

7.之前使用逻辑回归方法预测IPO市场,这里用机器学习来预测股票市场。

  7.1.首先要针对分析的类型研究一下,股票市场会有很多不同的类型嘛。

  7.2.然后就是我们能够从股票市场上学到一些东西,当然这是多方面的。

  7.3.这里动真刀了,教你如何开发一个交易策略。

    分为几个点吧,首先是延迟分析的周期,不然你分析完后时间已经过了,则得不偿失。

            然后是使用支持向量回归,来构建一个模型。

            最后来建模吧,再教你一个动态时间扭曲,这个名字nice啊。

  7.4.最后来一个小结咯。

  

8.再来一个案例吧,建立一个图片相似度的引擎。

  顾名思义,就是找到类似的图片。

  8.1.首先当然要了解一下图像的机器学习了。

  8.2.然后需要了解一下处理图像的知识。

  8.3.基础了解之后,来学一下如何查找相似的图像吧,这个当然是核心内容了。

  8.4.接下来就是了解深度学习了,这个应该就是深入学习图像之间的关系了。涉及到底层的操作。

  8.5.然后当然就是展示成果的引擎了,构建一个图像相似度的一个系统。

  8.6.最后来一个小结吧。

9.来一个聊天机器人吧。这个其实都耳熟能详了吧。

  9.1.首先了解一下图灵测试吧。这个最基础的东西了。

  9.2.然后就是了解一下聊天机器人历史和意义。

  9.3.开始进行设计了,要怎么实现,用什么方法,现在开始想啦。

  9.4.开始撸代码了,打造一个聊天机器人。

  9.5.最后来一个小结吧。

10.最后同样来一个有实际意义的功能,推荐引擎。

  现在大多新闻APP都基本实现按需分配了。

  10.1.首先是了解一下什么是协同过滤,这里分了两种,一种基于用户,一种基于项目的过滤。

  10.2.然后是了解一下什么是内容过滤,这个就是过滤的内在细节了。

  10.3.讲解一下什么是混合系统,将一种复杂的东西按照用户的需求来进行筛选的一个系统。

  10.4.开始撸代码了,打造一个推荐系统。

  10.5.最后来一个小结。

11.最最后,来一个个人总结。

  现在本人对Python和机器学习一窍不通。纯小白。

  看完这本书后,不知道又是怎样的一个我。开始漫长的机器学习之路吧。我爱robot。

  所以就第一章讲了一点基础,剩下的9章都是项目了,这样安排比较合理,我也很喜欢。

  项目才是推动知识的发展的根本。

原文地址:https://www.cnblogs.com/Jason-Jan/p/9153085.html

时间: 2024-10-12 11:45:18

Alexander的Python机器学习 之目录分析。的相关文章

python好书推荐:【A028】[异步图书].Python机器学习:预测分析核心算法

Python机器学习:预测分析核心算法pdf获取方式:点这里 请注意,本并没有直接告诉薇姬,他认为她是一个具有奉献精神和坚定信念的人.然而,对于薇姬来说,她不难承认自己具备这些特征,也很容易将其应用于自己的工作中.即使薇姬认为自己并不具备奉献精神和坚定信念,也无损这种新关系.Python机器学习:预测分析核心算法. 不管薇姬的自我评价如何,本说的都是实话,所以他的观点在最坏的情况下则会被忽视,在最好的情况下则会促使薇姬对自己(和本)感觉良好.基于人的本性,即便薇姬在现实中并不具有奉献精神和坚定信

Python机器学习:5.6 使用核PCA进行非线性映射

许多机器学习算法都有一个假设:输入数据要是线性可分的.感知机算法必须针对完全线性可分数据才能收敛.考虑到噪音,Adalien.逻辑斯蒂回归和SVM并不会要求数据完全线性可分. 但是现实生活中有大量的非线性数据,此时用于降维的线性转换手段比如PCA和LDA效果就不会太好.这一节我们学习PCA的核化版本,核PCA.这里的"核"与核SVM相近. 运用核PCA,我们能将非线性可分的数据转换到新的.低维度的特征子空间,然后运用线性分类器解决. 核函数和核技巧 还记得在核SVM那里,我们讲过解决非

Python机器学习:7.1 集成学习

集成学习背后的思想是将不同的分类器进行组合得到一个元分类器,这个元分类器相对于单个分类器拥有更好的泛化性能.比如,假设我们从10位专家那里分别得到了对于某个事件的预测结果,集成学习能够对这10个预测结果进行组合,得到一个更准确的预测结果. 后面我们会学到,有不同的方法来创建集成模型,这一节我们先解决一个基本的问题:为什么要用集成学习?她为什么就比单个模型效果要好呢? 本书是为初学者打造的,所以集成学习这里我们也只关注最基本的集成方法:投票法(majority voting).投票法意味着我们在得

Python机器学习:6.3 使用学习曲线和验证曲线 调试算法

这一节我们学习两个非常有用的诊断方法,可以用来提高算法的表现.他们就是学习曲线(learning curve)和验证曲线(validation curve).学习曲线可以判断学习算法是否过拟合或者欠拟合. 使用学习曲线判别偏差和方差问题 如果一个模型相对于训练集来说过于复杂,比如参数太多,则模型很可能过拟合.避免过拟合的手段包含增大训练集,但这是不容易做到的.通过画出不同训练集大小对应的训练集和验证集准确率,我们能够很轻松滴检测模型是否方差偏高或偏差过高,以及增大训练集是否有用. 上图的左上角子

Python机器学习:7.2 结合不同的分类算法进行投票

这一节学习使用sklearn进行投票分类,看一个具体的例子,数据集采用Iris数据集,只使用sepal width和petal length两个维度特征,类别我们也只是用两类:Iris-Versicolor和Iris-Virginica,评判标准使用ROC AUC. Python机器学习中文版目录(http://www.aibbt.com/a/20787.html) 转载请注明出处,Python机器学习(http://www.aibbt.com/a/pythonmachinelearning/)

分享《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

下载:https://pan.baidu.com/s/1sfaOZmuRj14FWNumGQ5ahw 更多资料分享:http://blog.51cto.com/3215120 <Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码高清中文版,338页,带目录和书签,文字能够复制粘贴.高清英文版,361页,带目录和书签,文字能够复制粘贴.中英文两版对比学习.配套源代码.经典书籍,讲解详细. 其中,高清中文版如图所示: 原文地址:http://blog.51cto.c

《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

资源链接:https://pan.baidu.com/s/1J61jH-fqwGceoId6F8mr5Q<Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码高清中文版,338页,带目录和书签,文字能够复制粘贴.高清英文版,361页,带目录和书签,文字能够复制粘贴.中英文两版对比学习.配套源代码.经典书籍,讲解详细.其中,高清中文版如图所示: 原文地址:http://blog.51cto.com/14063572/2317037

分享《Python机器学习—预测分析核心算法》+PDF+源码+Michael Bowles+沙嬴

下载:https://pan.baidu.com/s/1JnyeiZwh74MIWo1LB4pIqA 更多资料分享:http://blog.51cto.com/14087171 <Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码高清中文版,338页,带目录和书签,文字能够复制粘贴.高清英文版,361页,带目录和书签,文字能够复制粘贴.中英文两版对比学习.配套源代码.经典书籍,讲解详细. 其中,高清中文版如图所示: 原文地址:http://blog.51cto.

学习《Python机器学习(第2版)》中文PDF+英文PDF+代码分析+Sebastian

学习数据科学的初学者,想进一步拓展对数据科学领域的认知,推荐学习<Python机器学习(第二版)>.<Python机器学习(第二版)>将机器学习背后的基本理论与应用实践联系起来,聚焦于如何正确地提出问题.解决问题,能帮助了解如何使用Python解决数据中的关键问题. <Python机器学习(第2版)>介绍如何用Python和基于Python的机器学习软件库进行实践,对机器学习概念的必要细节进行讨论,同时对机器学习算法的工作原理.使用方法以及如何避免掉入常见的陷阱提供直观