机器学习 —— 机器学习的动机和应用

网易公开课学习笔记

机器学习的定义

　　Arthur Samuel：“在不直接针对问题进行编程的情况下，赋予计算机学习能力的一个研究领域”

　　　　　　　　　　让计算机学会如何下棋，并超过自己

　　Tom Mitchell：给计算机一个任务T和性能测试方法P，如果在经验E的影响下，P对T的测量结果得到了改进，我们说程序从E中得到了学习

　　　　　　　　　　E（experience）:程序不断和自己下棋的经历

　　　　　　　　　　T（task）：下棋

　　　　　　　　　　P（performance）：程序和人下棋胜出的概率

一、supervised learning（监督性学习）

　　学习标准输入和标准答案间的关系，给我们提供一个某种意义上的正确答案

　　回归问题 regression problem，需要测量的变量是连续的：房屋面积和房屋价格的关系

　　分类问题 classification
problem，需要测量的变量是离散的：乳腺癌肿瘤数据，肿瘤大小和肿瘤是否为良性的关系（是否为良性，取值只有0或1），

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　通过肿瘤大小，病人年龄，肿瘤是否良性的数据来预测新输入的病人数据结果是否为良性

　　支持向量算法，将数据映射到无线纬的空间中，处理无限种特征

二、learning theory（学习理论）

三、unsupervised learning（无监督性学习）

　　聚类问题，用户画像、分类

　　计算机群组织、社交网络分析、市场划分

四、reinforcement learning（加强学习）

　　进行一次性决策，如何定义一个好的行为

　　应用：机器人领域、网页爬取

机器学习 —— 机器学习的动机和应用,布布扣,bubuko.com

时间： 2024-11-05 18:05:25

机器学习 —— 机器学习的动机和应用的相关文章

NTU-Coursera机器学习:机器学习基石 (Machine Learning Foundations)

课讲内容这门课以8周设计,分成 4个核心问题,每个核心问题约需2周的时间来探讨.每个约2个小时的录影中,每个小时为一个主题,以会各分成4到5个小段落,每个段落里会有一个后多个随堂的练习.我们在探讨每个核心问题的第二周.依上所述,課程的規畫如下: When Can Machines Learn? [何时可以使用机器学习] 第一周:(NTU-Coursera机器学习:机器学习问题与二元分类) 第一讲:The Learning Problem [机器学习问题]第二讲:Learning to Answ

机器学习 | 机器学习评估方法

机器学习评估方法留出法(hold out):数据集预留出一部分数据为测试集,将数据集 D 划分为训练集 S 和测试集 T.大概比例为测试集占全局数据量的(1/5~1/3) 留一法:留一法是留出法的特例,即每次测试集 T 只留一个数据,剩下的作为训练集 S K折交叉验证(k-fold cross validation):每次将数据划分 k 份,其中一份作为测试集 T,剩下的作为训练集 S:重复以上过程 k 次,特别地每次用作测试集 T 的都是各不相同的. 自助法(bootstrapping):每

基于C#的机器学习--机器学习的基本知识

机器学习的基本知识作为一个终生的微软开发人员,我经常看到开发人员努力寻找解决日常问题所需的资源.让我们面对现实吧,我们没有人有时间按照自己喜欢的方式做事,我们中很少有人有幸在真正的研发部门工作.虽然这些年来我们已经走过了相当长的一段旅程,还记得曾经我们通过桌上的C程序员参考资料和其他50本书中翻找资料,到现在能够在谷歌中快速搜索并得到我们想要的东西.但现在人工智能时代已经到来,情况有些不同了. 作为c#开发人员,当涉及到机器学习时,谷歌搜索并不总是我们最好的朋友,因为几乎所有正在使用的东西都是

基于C#的机器学习--机器学习建模的基础

构建ML模型的步骤现在我们已经看了解到了一些ML应用程序的例子,问题是,我们如何构建这样的ML应用程序和系统? 下图总结了我们使用ML开发应用程序的方法,我们将在下面更详细地讨论这个问题: 如上图所示,建立学习模型的步骤如下: 问题定义:任何项目的第一步不仅是理解我们想要解决的问题,也定义了我们如何使用ML来解决问题.这第一步无疑是构建有用的ML模型和应用程序中最重要的一步.在开始构建ML模型之前,我们至少应该回答以下四个问题: l 当前碰到了什么问题?这是我们描述和陈述我们试图解决的问题的

第四篇[机器学习] 机器学习，线性回归的优化

当我们的数据存在多重共线性时,即其中的一个自变量可以用其他一个或几个自变量的线性表达式进行表示,你会发现,拟合之后的方差会特别大一般说来当解释变量的容忍度(TOLERANCE)小于0.10或者方差膨胀因子(VIF)大于10时,说明变量之间存在多重共线性现象,会影响到回归模型的正确估计. 方差膨胀因子VIF=1/(1-r2),r是线性相关系数具体可以参考:多重共线性,怎么判断是否有多重共线性,怎么解决 scikit-learn介绍了一种岭回归,岭回归就是带二范数惩罚的最小二乘回归. 通过放弃最

第五篇[机器学习] 机器学习，逻辑回归come on

逻辑回归,简单的说,就是用sigmoid函数把连续函数归一化转化成离散的几个可能的结果. 逻辑回归的算法最大似然法: 我自己的理解,最大似然法就是在你观测到某一系列事件出现的可能性之后,倒推该事件最可能的概率,这个最可能的概率会使这一系列事件发生的可能性无限接近我们观测到的可能性. 梯度下降法/随机梯度下降法推荐看这些文章: http://www.jianshu.com/p/1121509ac1dc http://blog.csdn.net/zouxy09/article/details/8

机器学习入门资源--汇总

机器学习入门资源--汇总基本概念机器学习机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多门学科.机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法.机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法.因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论.算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法. 下面从微观到宏观试着梳理一下机器学习的范畴:

机器学习一监督学习和无监督学习的区别

前话: 最近一直想学机器学习的东西,无奈自己的书太多但无法专心看一本,纯理论的东西看了感觉不记下来就忘记类,所以我想理论学习和实践一起. 所以最近想把机器学习实战这本书看完,并做好记录.加油.!~ 一:什么是监督学习? 监督学习(supervised learning):通过已有的训练样本(即已知数据以及其对应的输出)来训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判断从而实现分类的目的,那么这个最优模型也就具有了对未知数据进行分类的能力.

人工智能、机器学习和认知计算入门指南

几千年来,人们就已经有了思考如何构建智能机器的想法.从那时开始,人工智能 (AI) 经历了起起落落,这证明了它的成功以及还未实现的潜能.如今,随时都能听到应用机器学习算法来解决新问题的新闻.从癌症检测和预测到图像理解和总结以及自然语言处理,AI 正在增强人们的能力和改变我们的世界. 现代 AI 的历史包含一部伟大的戏剧应具有的所有要素.上世纪 50 年代,随着对思维机器及阿兰·图灵和约翰·冯·诺依曼等著名人物的关注,AI 开始崭露头角.尽管随后经历了数十年的繁荣与萧条,并被寄予了难以实现的厚望,