机器学习的一些基本概念

回归

在数学上来说是给定一个点集,能够用一条曲线去拟合之,如果这个曲线是一条直线,那就被称为线性回归,如果曲线是一条二次曲线,就被称为二次回归,回归还有很多的变种,如locally weighted回归,logistic回归,等等。

训练集(training set)或者训练数据(training data):输入数据,一般称为x

拟合的函数(或者称为假设或者模型):一般写做 y = h(x)

输入数据的维度(特征的个数,#features):n

典型的机器学习的过程:

时间: 2025-01-01 05:36:07

机器学习的一些基本概念的相关文章

【机器学习】一些基本概念及符号系统

注:其实自认为还是非常喜欢数学的,但是对于复杂的公式还是有种恐惧感,就像最开始学英语时,对英语的感觉一样.但是数学与英语不同的地方在于,你可以尽情的刨根问底,从最基础的知识开始了解,直到最终把一个符号或者公式的含义弄明白.在机器学习的过程中,也会碰到各种各样的符号,尤其是遇到多参数,多样本的情况时,更是让人眼花缭乱.最近学习完coursera上吴恩达的机器学习前两周的课程,有种豁然开朗的感觉.在此做一个小结. 1. 一些基本概念 图1. 机器学习的基本过程 训练集(Training Set):为

机器学习笔记之基础概念

本文基本按照<统计学习方法>中第一章的顺序来写,目录如下: 1. 监督学习与非监督学习 2. 统计学习三要素 3. 过拟合与正则化(L1.L2) 4. 交叉验证 5. 泛化能力 6. 生成模型与判别模型 7. 机器学习主要问题 8. 提问 正文: 1. 监督学习与非监督学习 从标注数据中学习知识的规律以及训练模型的方法叫做监督学习,但由于标注数据获取成本较高,训练数据的数量往往不够,所以就有了从非标注数据,也就是非监督数据中学习的方法. 由于非监督数据更容易获取,所以非监督学习方法更适合于互联

机器学习【1】概念

机器学习就是把无序的数据转换成有用的信息. 机器学习的主要任务就是分类,通过通过训练数据训练算法,最终可以将实际的数据分到合适的类别中 监督学习算法:预测目标变量的值 k-means算法,线性回归 朴素贝叶斯算法,局部加权线性回归 支持向量机,ridge回归 决策树,lasso最小回归系数估计 无监督学习算法:不需要预测目标变量的值 k-均值,最大期望算法 DBSCAN,parzen窗设计 确定哪种算法之后,还要确定目标变量的类型: 离散型:是/否,1/2/3     分类器算法 连续性:-99

机器学习介绍及基本概念

什么是机器学习? 机器学习技术的存在,使得人们可以享受强大的垃圾邮件过滤带来的便利,拥有方便的文字和语音识别软件,能够使用可靠的网络搜索引擎,同时在象棋的网络游戏对阵中棋逢对手,而且在可见的将来,我们将拥有安全高效的无人驾驶汽车. 分类: 监督学习(supervised learning).无监督学习(unsupervised learning)和强化学习(reinforcement learning). 监督学习: 监督学习的主要目的是使用有类标的训练(training)数据构建模型,我们可以

机器学习中的一些概念

训练集(traning set/data):用来训练,产生模型的算法的数据集 测试集(testing set/data):用来训练,产生模型的算法的数据集):用来专门进行测试已经学习好的模型或者算法的数据集. 特征向量(feature/feature vector):属性集合,通常用一个向量来表示,附属于一个实例. 标记(label):实例类别的标记(用模型测试完数据后得到的结果). 正例(position example) 反例(negative example) 分类(classificat

【Machine Learn】机器学习及其基础概念简介

机器学习及其基础概念简介 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结合视频学习和书籍基础的笔记所得.本系列文章将采用理论结合实践方式编写.首先介绍机器学习和深度学习的范畴,然后介绍关于训练集.测试集等介绍.接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树.临近取样.支持向量机.神经网络算法)监督学习之回归(线性回归.非线性回归)非监督学习(K-means聚

机器学习 之 算法介绍

什么是程序(Program) 计算机程序,是指为了得到某种结果而可以由计算机(等具有信息处理能力的装置)执行的代码化指令序列(或者可以被自动转换成代码化指令序列的符号化指令序列或者符号化语句序列). 通俗讲,计算机给人干活,但它不是人,甚至不如狗懂人的需要(<小羊肖恩>里的狗是多么聪明可爱又忠诚于主人).那怎么让它干活呢,那就需要程序员用某种编程语言来写程序,编程语言就是计算机能理解的语言,计算机可以执行这些程序(指令),最终完成任务.下边的C++程序是完成n的阶乘: int n = std:

关于机器学习和深度学习的资料

声明:转来的,原文出处:http://blog.csdn.net/achaoluo007/article/details/43564321 编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等.而且原文也会不定期的更新,望看到文章的朋友能够学到更多. <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost 到随机森林.Deep Learning. &

机器学习之线性递归

一.先弄清楚机器学习的几个概念: 训练集:训练样本,每个样本都由表示要学习的特征集(输入变量)和目标(输出变量) 设训练样本数为m 输入特征\变量input : x  其中每个样本用 表示(第i个样本),样本中每个特征/输入用表示(第i个样本中的第j个特征) 输出特征/变量output : y     其中每个样本用 表示(第i个样本),每个样本只有一个输出. 更新参数/权值 weight : theat   每个输入x对应一个theta, 用表示 因此第i个样本集用表示. 二.监督的机器学习算