机器学习基础概念笔记

监督学习:分类和回归属于监督学习。这类算法必须知道预测什么,即目标变量的分类信息。

  常见算法:k-近邻算法、线性回归、朴素贝叶斯算法、支持向量机、决策树、Lasso最小回归系数估计、Ridge回归、局部加权线性回归

无监督学习:数据没有类别信息,不给定目标值。

  常见算法:K-均值、最大期望算法、DBSCAN、Parzen窗设计

机器学习应用步骤:

收集数据——准备输入数据——分析输入数据——训练算法——测试算法——使用算法

另一种框架:

  训练集——提取特征向量—— 结合一定的算法 ——得到结果

分类和回归算法的评估:

  1、准确率    2、速度    3、强壮性    4、可解读性

分类:类别型

回归:连续数值型

时间: 2024-10-12 16:43:06

机器学习基础概念笔记的相关文章

Day2 机器学习基本概念——笔记整理总结

td p { margin-bottom: 0cm } p { margin-bottom: 0.25cm; line-height: 120% } Day2 机器学习基本概念 Eg1. 样例 天气 温度 风力 享受运动 1 晴 暖 小 是 2 晴 暖 大 是 3 晴 适中 大 否 4 雨 冷 大 否 5 晴 适中 适中 是 Eg2. 样例 面积(平方米) 学区(1-10) 房价(100$) 1 100 8 1000 2 120 9 1300 3 60 6 800 4 80 9 1100 1.基

解读机器学习基础概念:VC维的来龙去脉

原作者:vincentyao  原文链接: http://dataunion.org/14581.html 目录: 说说历史 Hoeffding不等式 Connection to Learning 学习可行的两个核心条件 Effective Number of Hypotheses Growth Function Break Point与Shatter VC Bound VC dimension 深度学习与VC维 小结 参考文献 VC维在机器学习领域是一个很基础的概念,它给诸多机器学习方法的可学

机器学习基础概念之监督学习与无监督学习

一句话明晰概念:不用编程制定机器做什么,机器有能力自己学习. 三种最基础的机器学习算法:决策树.线性回归.K-means聚类. 监督与无监督学习 周志华通过敲西瓜案例有以下讲解: 监督学习是在敲西瓜听声音判断好坏过程中有懂行的人告诉你这个瓜的好坏,给不同的声音贴上了好坏瓜的标签,慢慢学习声音特征之间的关系,最后通过特征能预测的模型. 监督模型又可分为分类模型与回归模型.分类模型预测标签为分类变量,回归模型预测标签为数值变量. 无监督学习是没有懂行的人告诉你瓜的好坏,只能对声音特征做分类(浑浊.清

解读机器学习基础概念:VC维的来龙去脉 | 数盟

http://dataunion.org/14581.html

【Machine Learn】机器学习及其基础概念简介

机器学习及其基础概念简介 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结合视频学习和书籍基础的笔记所得.本系列文章将采用理论结合实践方式编写.首先介绍机器学习和深度学习的范畴,然后介绍关于训练集.测试集等介绍.接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树.临近取样.支持向量机.神经网络算法)监督学习之回归(线性回归.非线性回归)非监督学习(K-means聚

linux基础概念和个人笔记总结(6)

防伪码:曾经梦想仗剑走天涯,回过头,却发现还是放不下家的牵挂 后续理论的验证图文详解,我会更新,希望大家可以参考 第十一章 FTP文件传输服务 1.FTP连接 控制连接:tcp21端口,用于发送ftp命令信息 数据连接:tcp20端口,用于上传.下载数据 数据连接的建立类型: a.主动模式:服务器从20端口主动向客户端发起连接 b.被动模式:服务端在指定范围内某个端口被动等待客户端连接 2.FTP用户的类型 匿名用户:anonymous或ftp 本地用户:账号名称.密码等信息都保存在passwd

linux基础概念和个人笔记总结(1)

防伪码:青,取之于蓝而青于蓝:冰,水为之寒而寒于水 各位亲爱的朋友们,本次分为6次更新,共12章节,请大家务必温故而知新,重在消化理解,熟练掌握linux基础概念与命令 一.linux系统管理与维护 1.分区:/boot(100-200m) swap:(交换分区,建议是物理分区的1.5-2倍) /:剩余空间 root是管理员用户,区分于administrator 2.对初学者建议:关闭iptables a.chkconfig iptables off b.打开/etc/sysconfig/sel

机器学习实战笔记1(机器学习基础)

1:如何选择合适的算法 2:python简介 (1)   python的优势:相对于matlab,matlab单个软件授权就要花费数千美元,也没有一个有影响力的大型开源项目.相对于c++/c/java,完成简单的操作就需要编写大量的代码:而如今我们应该花费更多的时间去处理数据内在的含义,而无需花费太多精力解决计算机如何得到数据结果(python简洁) (2)   python具有numpy科学函数库,它是一个使运算更容易.执行更迅速的库:另外还有matplotlib绘图工具. 3:python语

【龙书笔记】语法分析涉及的基础概念简介

本篇笔记是我对龙书第2.3-2.5节内容的理解,主要介绍编译器前端关于语法分析的众多基础概念.下篇笔记将根据本篇笔记的主要内容,实现一个针对简单表达式的后缀式语法翻译器Demo(原书中是java实例,我给出的将是逻辑一致的Python版本的实现). 1. 语法分析(Syntax Analysis) 简单来说,语法分析的任务是分析输入的符号字符串(string of symbols, 通常是词法分析产生的tokens)是否遵循某种语言在其上下文无关文法(context-free grammar)中