初学机器学习的几点建议

学习资料:

1.sklearn的代码,可以参照中文的,然后再seedbank上面操作(网页可以直接跑代码,甚至是GPU)

seedbank:http://tools.google.com/seedbank/seed/5186378094608384

seedbank怎么导入文件或图片(谷歌云盘Colaboratory如何载入文件):

https://blog.csdn.net/einstellung/article/details/81006408

sklearn中文文档:http://cwiki.apachecn.org/pages/viewpage.action?pageId=10814293

英文文档:http://scikit-learn.org/stable/modules/linear_model.html#ridge-regression

别人的意见

通过我自己的这大半年的接触和了解,结合找工作需要现对于如何入门机器学习提几点自己的看法。如果你以后要想干算法工程师、机器学习工程师,那么请你好好看一下我下面说的话。

2018年05月18日 17:51:41============================================================================

总路线

先学机器学习,再学深度学习(实验者某大神学长的建议),至少精通深度学习的一个方向:CV和NLP。期间要插科打诨地复习好数据结构、数学基础和强化你的编程能力。

---------------------------------------------------------------------------------------------------------------------------

  • 数学功底:概率论、线性代数、高数、信息论(主要是信息熵那部分)。
  • 数据结构:树、栈、链表、队列、图!慢慢琢磨吧。(要有优化算法复杂度的意识)
  • 编程能力:请转移到leetcode、赛码阵营好好磨练。《剑指offer》这本书是需要你好好看的。

----------------------------------------------------------------------------------------------------------------------------------

书籍的话:《统计学习方法》(李航)、《机器学习》西瓜书、《深度学习》(Yoshua Bengio & Ian GoodFellow)、《PRML》(选看)、《利用python进行数据分析》

吴恩达的深度学习,机器学习课程,一些其他机器学习课程都可以看。在这里,推荐一下中国海洋大学 黄海广 博士牵头的将吴恩达视频做成的中文版学习笔记:机器学习深度学习。我自己还没有看,不清楚质量如何,但是应该比较省事了。有钱的话,推荐优达学城,不过贵,不免费。深度学习的工具tensorflow和pytorch,可以买本书看,学会看官方文档,这两个工具掌握一个就好。可以通过打比赛(天池、京东、腾讯、kaggle等),做项目,进一步强化自己的动手能力。

大数据的话要了解并行化分布式的东西,比如hadoop,spark,sql等。因为内容很多,有选择性的去看。

机器学习主要模型:线性回归,逻辑回归,svm,各种树模型。原理公式要会,会推导。(如果你要走机器学习岗的工作),现在算法岗对深度学习用处多一些。

原文地址:https://www.cnblogs.com/sharryling/p/10520440.html

时间: 2024-11-08 23:33:39

初学机器学习的几点建议的相关文章

程序员初学机器学习的四种方式

http://blog.jobbole.com/67621/ 本文由 伯乐在线 - XiaoxiaoLi 翻译.未经许可,禁止转载!英文出处:Jason Brownlee.欢迎加入翻译组. 学习机器学习有很多方法,大多数人选择从理论开始. 如果你是个程序员,那么你已经掌握了把问题拆分成相应组成部分及设计小项目原型的能力,这些能力能帮助你学习新的技术.类库和方法.这些对任何一个职业程序员来说都是重要的能力,现在它们也能用在初学机器学习上. 要想有效地学习机器学习你必须学习相关理论,但是你可以利用你

程序员初学机器学习算法

英文原文:4 Self-Study Machine Learning Projects 学习机器学习有很多方法,大多数人选择从理论开始. 如果你是个程序员,那么你已经掌握了把问题拆分成相应组成部分及设计小项目原型的能力,这些能力能帮助你学习新的技术.类库和方法.这些对任何一个职业程序员来说都是重要的能力,现在它们也能用在初学机器学习上. 要想有效地学习机器学习你必须学习相关理论,但是你可以利用你的兴趣及对知识的渴望,来激励你从实际例子学起,然后再步入对算法的数学理解. 通过本文你可以学习到程序员

给初学嵌入式的菜鸟一点建议

1.学习linux 根据我在论坛的了解,我选择学习嵌入式linux,刚好我们学校也重视嵌入式linux,从实验室到课程安排都是关于嵌入式linux方面,天时地利!这里我把学习linux的经验和教训说说. 可以这样说,在论坛里说道学习linux差不多就学习linux内核.于是我电脑里安装了linux就开始看linux内核方面的书了.我记得来学校以前就买到一本陈莉君的讲linux内核的第一版,现在有第二版了.我就开始看那本说,大家说linux内核情景分析不错,我就买了上下册,后来又买了 <深入理解l

机器学习模型的实用建议

高方差/偏差的解决策略 高方差就是模型的训练误差与验证误差相去甚远,一般由于模型过拟合使得训练误差很低而验证误差很高:高偏差就是模型的训练误差与验证误差非常逼近但是都很高,往往由于模型欠拟合使得两者误差都很高. 高方差 高偏差 搜集更多的样本 获得额外特征 属性约简 获得多项式.核特征 增大正则化系数 减小正则化系数 引入一种观察算法性能的工具:学习曲线.学习曲线是一条反映训练误差与验证误差随训练样本量之间关系的曲线.如果算法是高偏差,那么你收集再多数据集也没用.高偏差的学习曲线训练线和验证线在

浅谈我对机器学习和文本挖掘的新的理解

转眼间已经工作了一段时间了,回想起2014年初学机器学习时的付出.艰苦和努力,感觉都是值得的.从现在往前看,我是沿着“计算机->统计学->数据分析->数据挖掘->机器学习->文本挖掘”的路径走过来的,我觉得这个思路还是属于比较传统的进阶方法,学习的内容有不少的冗余,但相对来说更稳健一些.今天写这篇文章的目的是想总结一下我最近关于文本挖掘的工作体会以及我对机器学习的一些新的看法,只为探讨,还望与大家共勉. 我先来说一些文本挖掘的东西.似乎大家做Text Mining的不太多,可

机器学习系列(7)_机器学习路线图(附资料)

作者: 龙心尘 && 寒小阳 时间:2016年2月. 出处:http://blog.csdn.net/longxinchen_ml/article/details/50749614 http://blog.csdn.net/han_xiaoyang/article/details/50759472 声明:版权所有,转载请联系作者并注明出处 1. 引言 也许你和这个叫『机器学习』的家伙一点也不熟,但是你举起iphone手机拍照的时候,早已习惯它帮你框出人脸:也自然而然点开今日头条推给你的新闻

机器学习研究与开发平台的选择

目前机器学习可以说是百花齐放阶段,不过如果要学习或者研究机器学习,进而用到生产环境,对平台,开发语言,机器学习库的选择就要费一番脑筋了.这里就我自己的机器学习经验做一个建议,仅供参考. 首先,对于平台选择的第一个问题是,你是要用于生产环境,也就是具体的产品中,还是仅仅是做研究学习用? 1. 生产环境中机器学习平台的搭建 如果平台是要用于生产环境的话,接着有一个问题,就是对产品需要分析的数据量的估计,如果数据量很大,那么需要选择一个大数据平台.否则的话只需要一个单机版的平台就可以了. 1.1 生产

关于机器学习和深度学习的资料

声明:转来的,原文出处:http://blog.csdn.net/achaoluo007/article/details/43564321 编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等.而且原文也会不定期的更新,望看到文章的朋友能够学到更多. <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost 到随机森林.Deep Learning. &

机器学习和深度学习学习资料

比较全面的收集了机器学习的介绍文章,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. <机器学习经典论文/survey合集>介绍:看题目你已经知道了是什么内容,没错.里面有很多经典的机器学习论文值得仔细与反复的阅读. <Brief History of Machine Learning>25介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost到随机森林.Deep Learning. <