机器学习基础——机器学习概述

一. 什么是机器学习

机器学习是从人工智能中产生的一个重要学科分支，是实现智能化的关键。

机器学习是一门多领域的交叉学科，设计概率论，统计学，逼近论，凸分析，算法复杂度理论等多门学科，专门研究计算机怎样模拟或实现人类的学习行为，以获取新知识或技能，重新组织已有的知识结构使之不断改善自身的性能。　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　——百度百科

二. 发展历程

三. 机器学习方法

1. 有监督学习

有监督学习分为分类和回归。

分类形象地说就像是做考试的选择题，在训练集中满足这个条件的一堆，满足那个条件的一堆.....，最后根据你给出的测试集的条件判断它是属于哪一堆；

回归形象地说就像是做考试的填空题，根据训练集里给出的数据来大致模拟出一个函数模型，最后将给的测试集数据代入来推测答案。

2. 无监督学习

无监督学习分为聚类等。

无监督学习就没有固定的答案和方法，说白了就是找规律，只要你言之有理就行。例如上面的例子，将训练集进行找规律分类，既可以把“玩具”按照形状分，也可以按照颜色分，也可以按照大小分，只要有共同点就行。

3. 半监督学习

半监督学习：是把监督和无监督结合，因为生活中监督学习比较少，所以使用两者结合。

将无类标签的简单聚类分：按形状，按大小，按颜色....；由有类标签来确定到底是需要按形的，还是按色的...

聚类假设和流行假设的区别：聚类假设是处理处在相同聚类中的样本，而流行假设处理的是小的局部区域。数据越多拟合起来越真实。

4. 增强学习和多任务学习

增强学习：就像养猫，我们不告诉猫对错，只是对他的行为进行“奖惩”，慢慢的他自己就会学习来增强性能。

多任务学习：有的问题可以独立解决，但实际上很多问题是不能独立解决的，他们之间是有关系的，而多任务学习的出现就使有关联的任务之间可以共享信息。

原文地址：https://www.cnblogs.com/guojiaxue/p/12638668.html

时间： 2024-10-02 17:37:19

机器学习基础——机器学习概述的相关文章

python机器学习基础机器学习实战

python机器学习基础,以Python语言介绍.主要内容包括:机器学习的基本概念及其应用:实践中最常用的机器学习算法以及这些算法的优缺点:在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面:模型评估和调参的高级方法,交叉验证和网格搜索:管道的概念:如何应用到文本数据上,文本特有的处理方法. 机器学习实战,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化.通过实例从中学会机器学习的核心算法,并能将其运用于一些策略性

【机器学习实战】第1章机器学习基础

第1章机器学习基础机器学习概述机器学习就是把无序的数据转换成有用的信息. 获取海量的数据从海量数据中获取有用的信息我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的意义. 机器学习场景例如:识别动物猫模式识别(官方标准):人们通过大量的经验,得到结论,从而判断它就是猫. 机器学习(数据学习):人们通过阅读进行学习,观察它会叫.小眼睛.两只耳朵.四条腿.一条尾巴,得到结论,从而判断它就是猫. 深度学习(深入数据):人们通过深入了解它,发现它会'喵喵'的叫.与同类的猫科动物

机器学习实战之第一章机器学习基础

第1章机器学习基础机器学习概述机器学习就是把无序的数据转换成有用的信息. 获取海量的数据从海量数据中获取有用的信息我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的意义. 机器学习场景例如:识别动物猫模式识别(官方标准):人们通过大量的经验,得到结论,从而判断它就是猫. 机器学习(数据学习):人们通过阅读进行学习,观察它会叫.小眼睛.两只耳朵.四条腿.一条尾巴,得到结论,从而判断它就是猫. 深度学习(深入数据):人们通过深入了解它,发现它会'喵喵'的叫.与同类的猫科动物

第一章：机器学习基础

第一部分:分类本书前两部分主要探讨监督学习(supervisedieaming).在监督学习的过程中,我们只需要给定输入样本集,机器就可以从中推演出指定目标变量的可能结果.监督学习相对比较简单,机器只需从输入数据中预测合适的模型,并从中计算出目标变量的结果. 监督学习一般使用两种类型的目标变量:标称型和数值型.标称型目标变量的结果只在有限目标集中取值,如真与假.动物分类集合{爬行类.鱼类.哺乳类.两栖类.植物.真菌};数值型目标变量则可以从无限的数值集合中取值,如0.100.42.0

机器学习资料《分布式机器学习算法理论与实践》+《白话机器学习算法》+《Python机器学习基础教程》

机器学习正在迅速改变我们的世界.我们几乎每天都会读到机器学习如何改变日常的生活. 人工智能和大数据时代,解决最有挑战性问题的主流方案是分布式机器学习! <分布式机器学习:算法.理论与实践>电子书资料全面介绍分布式机器学习的现状,深入分析其中的核心技术问题,并且讨论该领域未来的发展方向. 我认为第3章到第8章是核心,讲解分布式机器学习的框架及其各个功能,分别针对其中的数据与模型划分模块.单机优化模块.通信模块.数据与模型聚合模块加以介绍.最有用的是第9章,学习由分布式机器学习框架中不同选项所组合

【机器学习基础】混合和装袋

融合模型(Aggregation Model) 如果我们已经得到了一些特征或者假设,它们和我们做机器学习的目标有若干的一致性的话,我们可以将这些假设综合起来,让预测效果变得更好,这样的模型被称为融合模型. 融合模型是通过混合(mix)和组合(combine)一些假设的方式,得到更好的预测结果. 下面列举了四种不同的混合组合方式,并给出了数学表示形式: 当有多个假设时,我们选择检验误差最小的假设作为我们最信任的目标函数: 我们现在有多个假设,我们可以给每个假设一个投票的权利,综合所有假设的投票结果

机器学习实战笔记1(机器学习基础)

1:如何选择合适的算法 2:python简介 (1) python的优势:相对于matlab,matlab单个软件授权就要花费数千美元,也没有一个有影响力的大型开源项目.相对于c++/c/java,完成简单的操作就需要编写大量的代码:而如今我们应该花费更多的时间去处理数据内在的含义,而无需花费太多精力解决计算机如何得到数据结果(python简洁) (2) python具有numpy科学函数库,它是一个使运算更容易.执行更迅速的库:另外还有matplotlib绘图工具. 3:python语

【机器学习基础】线性可分支持向量机

引言接下里的一系列有关机器学习的博文,我将具体的介绍常用的算法,并且希望在这个过程中尽可能地结合实际应用更加深入的理解其精髓,希望所付出的努力能得到应有的回报. 接下来的有关机器学习基础博文主要根据机器学习技法课程的学习,围绕特征转换(feature transforms)这个主要工具,从以下三个方向进行探讨: 如果现在有很多特征转换可以使用的时候,我们该如何运用这些特征转换,如何控制特征转换中的复杂度的问题,从这个角度刺激了支持向量机(Support Vector Machine)算法的发展

机器学习基础2--评价回归模型

再次回到上一节的13次模型. 这个疯狂的曲线造成了一种现象过拟合. 很明显,你的房子不可能只值这么点价钱,所以看上去,这个13次模型甚至还不如一开始的二次模型. 那么现在有个疑问,我们应该怎样去选择最合适的模型? 我们想要准确预测,但是我们无法观测未来. 下面我们模拟一次预测过程: 1.我们随机将一些房子数据排除在外. 2.然后拟合剩下的数据 3.最后进行预测和推断. 术语: 训练集(training set):用来拟合模型的数据. 测试集(test set):排除出去的数据. 训练损失(tra

猜你喜欢

网售毕业生，谁的悲剧？

2015年7月2日,昆明学院在线淘宝店铺"昆明学院人才店"正式开张,65名毕业生以商品的身份出现在货架之上,标价1000元,还包邮,一时间舆论鼎沸,据相关数据统计,关注这一个话题的 ...

关于计应151/152《软件工程》课程实践的安排

通过前一阶段的准备,同学们已经掌握了软件开发流程的相关知识,尽管部分知识有待后续课程解决,但已经具备开始实践的必要知识,因此,从下周一开始,我们的课程实践项目正式开始.具体安排如下: 1.整个开发活动 ...

Java EE 学习（7）：IDEA + maven + spring 搭建 web（3）- 配置数据库

参考: https://my.oschina.net/gaussik/blog/513444 注:在阅读本文前,请先阅读: Java EE 学习(5):IDEA + maven + spring 搭建 ...

不使用data-ng-app指令的表达式

<!DOCTYPE html><html><head><meta http-equiv="Content-Type" content=&q ...

HBase的JavaAPI使用

Java Client API Overview HBase是用Java写的,支持用编程语言来动态操作管理数据库,能用命令行做的都能够用API来做. 主要的使用步骤例如以下: 1.创建一个 Confi ...

一元二次方程的求解

#include<stdio.h> #include<math.h> #define MIN 0.00001 int main() { float a,b,c; scanf(& ...

ubuntu14安装tensorflow并测试

1.ubuntu版本的选择:看了很多博文,建议使用ubuntu14,稳定兼容性好. 2.tensorflow的安装: http://wiki.jikexueyuan.com/project/tenso ...

Memcached 查询stats及各项状态解释

一.两个最常用状态查询(掌握第一个就完全OK了) 1)查看状态:printf “stats\r\n” |nc 127.0.0.1 11211 2)模拟top命令查看状态:watch “ech ...

aruba无线轻轨项目

在无线网络管理方面,必须具有无线的集中控管.智能调控.自动恢复.负载均衡等实用功能,所建无线网络可以适应多种环境的变化,可动态地保证良好的应用效果.还应具有远端AP数据进行采集.远程监控.终端定位等功 ...

DataGridView的高亮显示

再看视频的时候,看到视频上面有对DataGrid中的数据进行高亮显示实现功能,其中涉及到一个事件,是DataGrid1_ItemDataBound.实现的代码如下: 虽然视频上面可以实现,但是在VS2 ...

Swift-04-Designated&&Convenience

class ClassA { let numA:Int init(num: Int){ numA = num } } class ClassB: ClassA { let numB:Int overr ...

###MySql的更新 ----- select* from emp; select * from dept1; #####查询语句 update emp a,dept b set a.sal=a.s ...

Sublime text 3最新版注册码

—– BEGIN LICENSE —– Andrew Weber Single User License EA7E-855605 813A03DD 5E4AD9E6 6C0EEB94 BC99798F ...

从头认识java-7.2 接口

这一章节我们来讨论一下接口. 之前我们已经聊过抽象类,他已经进行了第一步的抽象,把某些方法抽象出来,然后在子类那里实现,但他不是完全抽象. 而接口,就是进一步抽象,它里面全是没有实现的方法,所以的方法 ...

linux 安装python-setuptools

> wget --no-check-certificate https://bootstrap.pypa.io/ez_setup.py > python ez_setup.py --ins ...

Windows Store 应用获得设备 ID 的几种方案

本文为个人博客备份文章,原文地址: http://validvoid.net/solutions-get-device-id-for-uwp/ 通过生成唯一的设备 ID 进行数据统计是应用开发中一个非 ...

vim小技巧

1.自定义关键字及其高亮颜色设置: 自定义关键字“UINT8”, “UINT16”,并将他们归类为"ucosType"; :syn keyword ucosType UINT8 U ...

asp.net下ajax.ajaxMethod使用方法

使用AjaxMethod可以在客户端异步调用服务端方法,简单地说就是在JS里调用后台.cs文件里的方法,做一些JS无法做到的操作,如查询数据库. 使用AjaxMethod要满足一下几点: 1.如果还没 ...

Ajax跨域问题的两种解决方法

浏览器不允许Ajax跨站请求,所以存在Ajax跨域问题,目前主要有两种办法解决. 1.在请求页面上使用Access-Control-Allow-Origin标头. 使用如下标头可以接受全部网站请求: ...

canvas为什么你指定一个比较小的宽高，但它实际占位却很多？

ccanvas默认的宽高占位是:300*150 px 所以当你画一个普通的举行,你指定的宽高小于默认宽高的时候,通过审查元素发现周围都是空白的.

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.