2006年,Geoffrey Hinton发表了一篇论文,他编写的多层神经网络对手写数字的识别率达到了98%。 从此揭开了Deep Learning 的大热狂潮。十多年后的今天,deep learning 已经深入我们的生活,应用到了很多高科技产品中。例如搜索结果排序、智能语音识别、Youtube视频推荐、AlphaGo击败世界围棋高手以及自动驾驶领域。
Scikit-Learn非常易于使用,并且包含很多高效机器学习算法,所以是学习Machine Learning的一个很好地切入点。
TensorFlow是一个要复杂的多的库,应用它可以在多GPU上服务器群组上训练和运行你的神经网络。它是由Google发明和维护的,从2015年11月开始开源。
掌握Python的应用,及常用类库例如NumPy,Pandas,Matplotlib等的主要方法。
同时需要掌握大学阶段的数学知识,微积分、线性代数、概率、统计等。
此次学习路线图:
第一部分 机器学习
Machine Learning 是什么?它能解决什么问题?机器学习的主要分类和基础概念都有哪些?
一个典型的机器学习项目包含哪些步骤?
如何用数据训练模型?
怎样做到成本最优?
处理、清洗、准备数据
选择和处理特征
选择模型并通过交叉验证来调整超参数
机器学习的主要挑战,主要是欠拟合和过拟合
减少训练数据维度
常见学习模型:线性和多项回归,逻辑递归,KNN,SVM,决策树,随机森林和集成方法
第二部分 神经网络和深度学习
神经网络是什么?它们的优点是什么?
用TensorFlow建立和训练神经网络
最重要的神经网络结构:前向神经网络,卷积网络,循环神经网络(RNN),长短时记忆网络(LSTM)和自动编码器
训练深度神经网络的技术
超大数据的神经网络定型
强化学习
第一部分主要应用Scikit-Learn,第二部分主要用TensorFlow。