四.特征缩放1.特征缩放的优点:Andrew在他的机器学习课程里强调,在进行学习之前要进行特征缩放,目的是保证这些特征都具有相近的尺度,这将帮助梯度下降算法更快地收敛.python里常用的是preprocessing.StandardScaler(),公式为:(X-mean)/std,得到的结果是,对于每个属性来说所有数据都聚集在0附近,方差为1.缺点:如果特征中有异常数值,那么缩放的结果会很不理想. 2.sklearn中的最小值/最大值缩放器from sklearn.preprocessing
一.神经网络1.为了进行梯度下降,误差函数不能是离散的,而必须是连续的.误差函数必须是可微分的.同时,要将离散预测变成连续预测,方法是将激活函数从阶跃函数变成S函数. 2.最大似然法:选出实际发生的情况所对应的概率更大的模型. 3.交叉熵(损失函数):将得到的概率取对数,对它们的相反数进行求和.准确的模型得到较低的交叉熵.交叉熵可以告诉我们两个向量是相似还是不同. 4.Logistic回归(对数几率回归)机器学习中最热门和最有用的算法之一,也是所有机器学习的基石.基本上是这样的:1)获得数据:2
一.线性回归1.线性回归:一种用于预测数值数据的非常有效的算法. 假设直线为y=w1x+w2:点为(p,q).调整直线的技巧:1)绝对值技巧:如果点在直线上方,y=(w1+pɑ)x+(w2+ɑ),其中ɑ为学习速率.点在直线下方,y=(w1-pɑ)x+(w2-ɑ).p存在的原因:a.如果点不在y轴的右侧,而在左侧,此时p为负,可保证直线绕点的方向旋转:b.如果点距y轴近,则p的值较小,直线一次旋转的角度就小,如果点距y轴远,则p的值较大,直线一次旋转的角度就大,这符合我们的期望.2)平方技巧:无论
四.动态规划1.在动态规划设置中,智能体完全了解表示环境特性的马尔可夫决策流程 (MDP).(这比强化学习设置简单多了,在强化学习设置中,智能体一开始不知道环境如何决定状态和奖励,必须完全通过互动学习如何选择动作.) 2.迭代方法求状态值函数迭代方法先对每个状态的值进行初始猜测.尤其是,我们先假设每个状态的值为 0.然后,循环访问状态空间并通过应用连续的更新方程修改状态值函数的估算结果. 3.动作值思考下 qπ?(s1?,right) 这个示例.这个动作值的计算方式如下所示:qπ?(s1?,ri
本文由 meelo 原创,请务必以链接形式注明 本文地址,简书同步更新地址 一对一的项目辅导是优达学城(udacity)纳米学位的一大亮点.本文将简要介绍优达学城机器学习工程师纳米学位的6个项目.项目覆盖了机器学习的主要领域,包括回归分析.分类.聚类.增强学习及深度学习. 项目 0: 预测泰坦尼克号乘客生还率 这个项目需要你手动地实现一个简单的机器学习模型——决策树.1912年泰坦尼克号在第一次航行中与冰山碰撞沉没,泰坦尼克号乘客生还数据集记录了之中891个乘客的性别.年龄.社会阶级.配偶数量等
前段时间因为店铺不能开门,我花了一些空余时间看了很多机器学习相关的资料,我发现目前的机器学习入门大多要不门槛比较高,要不过于着重使用而忽视基础原理,所以我决定开一个新的系列针对程序员讲讲机器学习.这个系列会从机器学习的基础原理开始一直讲到如何应用,看懂这个系列需要一定的编程知识(主要会使用 python 语言),但不需要过多的数学知识,并且对于涉及到的数学知识会作出简单的介绍.因为我水平有限(不是专业的机器学习工程师),这个系列不会讲的非常深入,看完可能也就只能做一个调参狗,各路大佬觉得哪些部分
机器学习基础 什么是机器学习 机器学习能让我们从数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义.简单的说机器学习就是把无序数据转换成有用的信息. 关键术语 特征(属性):对一类物体我们关心的性质,比如鸟的体重.翼展.脚蹼.后背颜色等 训练集:已经有分类的大量数据,是用来训练机器学习算法的数据样本集合. 训练样本:实例数据 目标变量:机器学习的预测结果 训练数据:用来训练算法 测试数据:用来评估算法 监督学习: 无监督学习: 机器学习主要任务 机器学习的主要任务时分类和回归.
目录 机器学习基础 什么是机器学习 机器学习 应用场景 海量数据 机器学习的重要性 机器学习的基本术语 监督学习和非监督学习 监督学习:supervised learning 非监督学习:unsupervised learning 机器学习工具介绍 Python 非 Python NumPy 函数库基础 测试 Numpy 库 测试 NumPy 库代码整合 总结 机器学习基础 什么是机器学习 机器学习的基本术语 监督学习和非监督学习 机器学习工具介绍 总结 人工智能的核心是机器学习,机器学习的本质
一.机器学习的简介 定义 Tom Mitchell给出的机器学习定义: 对于某类任务T和性能度量P,如果计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序从经验E学习. 百度百科给出的机器学习定义:机器学习是多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多门学科.专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能. 分类 监督学习(supervised learning):数据集是有标签的,