机器学习 | 机器学习评估方法

机器学习评估方法

  • 留出法(hold out):数据集预留出一部分数据为测试集,将数据集 D 划分为训练集 S 和测试集 T。大概比例为测试集占全局数据量的(1/5~1/3)
  • 留一法:留一法是留出法的特例,即每次测试集 T 只留一个数据,剩下的作为训练集 S
  • K折交叉验证(k-fold cross validation):每次将数据划分 k 份,其中一份作为测试集 T,剩下的作为训练集 S;重复以上过程 k 次,特别地每次用作测试集 T 的都是各不相同的。
  • 自助法(bootstrapping):每次从数据集 D 中有放回地采一个样本,并将这个样本放入训练集 S 中,共重复 m 次,此时训练集共有 m 个样本,而测试集 T 则为 D - S(此处的减法为集合减法)

自助法在样本量较少、难以有效划分训练集和测试集时很有用,而留出法k折交叉验证在样本量较多时更常用

原文地址:https://www.cnblogs.com/yuzhen233/p/8441045.html

时间: 2024-10-12 19:30:17

机器学习 | 机器学习评估方法的相关文章

NTU-Coursera机器学习:机器学习基石 (Machine Learning Foundations)

课讲内容 这门课以8周设计,分成 4个核心问题,每个核心问题约需2周的时间来探讨.每个约2个小时的录影中,每个小时为一个主题,以会各分成4到5个小段落,每个段落里会有一个后多个随堂的练习.我们在探讨每个核心问题的第二周.依上所述,課程的規畫如下: When Can Machines Learn? [何时可以使用机器学习] 第一周:(NTU-Coursera机器学习:机器学习问题与二元分类) 第一讲:The Learning Problem [机器学习问题]第二讲:Learning to Answ

机器学习 —— 机器学习的动机和应用

网易公开课学习笔记 机器学习的定义 Arthur Samuel:"在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域"  让计算机学会如何下棋,并超过自己 Tom Mitchell:给计算机一个任务T和性能测试方法P,如果在经验E的影响下,P对T的测量结果得到了改进,我们说程序从E中得到了学习 E(experience):程序不断和自己下棋的经历 T(task):下棋 P(performance):程序和人下棋胜出的概率 一.supervised learning(监督

基于C#的机器学习--机器学习的基本知识

机器学习的基本知识 作为一个终生的微软开发人员,我经常看到开发人员努力寻找解决日常问题所需的资源.让我们面对现实吧,我们没有人有时间按照自己喜欢的方式做事,我们中很少有人有幸在真正的研发部门工作.虽然这些年来我们已经走过了相当长的一段旅程,还记得曾经我们通过桌上的C程序员参考资料和其他50本书中翻找资料,到现在能够在谷歌中快速搜索并得到我们想要的东西.但现在人工智能时代已经到来,情况有些不同了. 作为c#开发人员,当涉及到机器学习时,谷歌搜索并不总是我们最好的朋友,因为几乎所有正在使用的东西都是

基于C#的机器学习--机器学习建模的基础

构建ML模型的步骤 现在我们已经看了解到了一些ML应用程序的例子,问题是,我们如何构建这样的ML应用程序和系统? 下图总结了我们使用ML开发应用程序的方法,我们将在下面更详细地讨论这个问题: 如上图所示,建立学习模型的步骤如下: 问题定义:任何项目的第一步不仅是理解我们想要解决的问题,也定义了我们如何使用ML来解决问题.这第一步无疑是构建有用的ML模型和应用程序中最重要的一步.在开始构建ML模型之前,我们至少应该回答以下四个问题: l  当前碰到了什么问题?这是我们描述和陈述我们试图解决的问题的

第四篇[机器学习] 机器学习,线性回归的优化

当我们的数据存在多重共线性时,即其中的一个自变量可以用其他一个或几个自变量的线性表达式进行表示,你会发现,拟合之后的方差会特别大 一般说来当解释变量的容忍度(TOLERANCE)小于0.10或者方差膨胀因子(VIF)大于10时,说明变量之间存在多重共线性现象,会影响到回归模型的正确估计. 方差膨胀因子VIF=1/(1-r2),r是线性相关系数 具体可以参考:多重共线性,怎么判断是否有多重共线性,怎么解决 scikit-learn介绍了一种岭回归,岭回归就是带二范数惩罚的最小二乘回归. 通过放弃最

第五篇[机器学习] 机器学习,逻辑回归come on

逻辑回归,简单的说,就是用sigmoid函数把连续函数归一化转化成离散的几个可能的结果. 逻辑回归的算法 最大似然法: 我自己的理解,最大似然法就是在你观测到某一系列事件出现的可能性之后,倒推该事件最可能的概率,这个最可能的概率会使这一系列事件发生的可能性无限接近我们观测到的可能性. 梯度下降法/随机梯度下降法 推荐看这些文章: http://www.jianshu.com/p/1121509ac1dc http://blog.csdn.net/zouxy09/article/details/8

01机器学习算法整体知识体系与学习路线攻略

入行机器学习有一年多了,做过大大小小的机器学习项目,参加数据竞赛等实践活动,从最初的懵懵懂懂到现在逐步的深入,也渐渐的有了很多的体会和理解,本篇文章主要来阐述机器学习的知识体系,以让更多人明白机器学习应该怎样学习.需要学习什么?这些问题就是本篇文章的主要讨论的内容,下面开始进行详细介绍. 先对本篇文章的目录做个介绍: 1.机器学习术语 2.常见算法类型 3.评估方法和指标 4.性能优化和超参数调优 1.机器学习术语 接下来正式介绍机器学习术语.机器学习术语作为作为最基本的常识问题,为了更好的学习

机器学习 一 监督学习和无监督学习的区别

前话: 最近一直想学机器学习的东西,无奈自己的书太多但无法专心看一本,纯理论的东西看了感觉不记下来就忘记类,所以我想理论学习和实践一起. 所以最近想把机器学习实战这本书看完,并做好记录.加油.!~ 一:什么是监督学习? 监督学习(supervised learning):通过已有的训练样本(即已知数据以及其对应的输出)来训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判断从而实现分类的目的,那么这个最优模型也就具有了对未知数据进行分类的能力.

人工智能、机器学习和认知计算入门指南

几千年来,人们就已经有了思考如何构建智能机器的想法.从那时开始,人工智能 (AI) 经历了起起落落,这证明了它的成功以及还未实现的潜能.如今,随时都能听到应用机器学习算法来解决新问题的新闻.从癌症检测和预测到图像理解和总结以及自然语言处理,AI 正在增强人们的能力和改变我们的世界. 现代 AI 的历史包含一部伟大的戏剧应具有的所有要素.上世纪 50 年代,随着对思维机器及阿兰·图灵和约翰·冯·诺依曼等著名人物的关注,AI 开始崭露头角.尽管随后经历了数十年的繁荣与萧条,并被寄予了难以实现的厚望,