对Inductive Bias(归纳偏置)的理解

参考资料:

https://en.wikipedia.org/wiki/Inductive_bias

http://blog.sina.com.cn/s/blog_616684a90100emkd.html

Machine Learning. Tom M. Mitchell

下面我认为比较关键的内容都用红色字体标注:

mokuram (mokuram) 于Tue Jan 4 05:22:24 2005)
提到:
就是学习器在学习的时候带有的偏见。
(这个说法不很准确)
比如决策数分类器,很多决策数都采用 奥砍姆剃刀 原则 这样的归纳偏置。
也就是说,在众多能解决问题的决策数中,选择最简单的。
具体有关这个问题的探讨,请参阅Tom的MACHINE LEARNING
中文版本国内有售
faiut (繁星满天) 于Tue Jan 4 10:25:09 2005)
提到:
这个概念理解起来总是模模糊糊的,
还不会用自己的话描述。

jueww (觉·Hayek) 于Tue Jan 4 13:02:01 2005)
提到:
我喜欢用偏好这个单词。
大概相对于model complexity之类。

mokuram (mokuram) 于Tue Jan 4 13:53:03 2005)
提到:
归纳偏置是隔标准的术语,英文是inductive bias

jueww (觉·Hayek) 于Tue Jan 4 20:16:58 2005)
提到:
但翻译成中文用偏置不好吧。。。
bias and variance analysis里面翻译成偏置、偏离才差不多。

mokuram (mokuram) 于Wed Jan 5 00:46:37 2005)
提到:
增华军先生在翻译TOM 的MACHINE LEARNING时,就是这样翻译的,
感觉MACHINE LEARNING时国外很著名的教材,
增先生的翻译水平,也还不错.

jueww (觉·Hayek) 于Wed Jan 5 10:05:22 2005)
提到:
怎么说都是各人偏好吧,反正没人会把中文写的论文当回事。
翻译一个术语真的需要对这个行业的中文和英文非常懂才行。
偏置是一个电子行业的术语,容易产生误解。
bias在ML中意思不止一个,用英语表达混乱了点,否则你也不会有这种疑问。
如果在中文时能够将两种意思用不同汉字表达,不是更好?
题归正传,我对BIAS的理解倒没有像你这么看教材看得仔细,TOM那本东东我没觉得
有多少用处,所以没仔细看过。我完全是凭文献中出现的上下文猜测这个单词的意思得。
我觉得用“model complexity”或者说"representation ability“代替BIAS
好像一般没什么问题,被你这么一问倒也发现真的不知道这个东东是说啥的了。。。
刚上网查了把,豁然开朗,嘿嘿:
Informally speaking, the inductive bias of a machine learning algorithm refers
to additional assumptions, that the learner will use to predict correct outpu
ts for situations that have not been encountered so far.
In machine learning one aims at the construction of algorithms, that are able
to learn to predict a certain target ouput. For this the learner will be prese
nted a limited number of training examples that demonstrate the intended relat
ion of input and output values. After successful learning, the learner is supp
osed to approximate the correct output, even for examples that have not been s
hown during training. Without any additional assumptions, this task cannot be
solved since unseen situations might have an arbitrary output value. The kind
of necessary assumptions about the nature of the target function are subsumed
in the term inductive bias. A classical example of an inductive bias is Occam‘
s Razor, assuming that the simplest consistent hypothesis about the target fun
ction is actually the best. Here consistent means that the hypothesis of the l
earner yields correct ouputs for all of the examples that have been given to t
he algorithm.
Approaches to a more formal definition of inductive bias are based on mathemat
ical logic. Here, the inductive bias is a logical formula that, together with
the training data, logically entails the hypothesis generated by the learner.
Unfortunately, this strict formalism fails in many practical cases, where the
inductive bias can only be given as a rough description (e.g. in the case of n
eural networks).
跟我猜的意思基本一样。。。

NeuroNetwork (刮开有奖:=>███████) 于Wed Jan 5 13:30:58 2005)
提到:
这两个bias根本就不是一回事

NeuroNetwork (刮开有奖:=>███████) 于Wed Jan 5 14:26:11 2005)
提到:
DT的bias首先是disjunctive probability similarity,然后才是the shorter the better

ihappy (人似秋鸿来有信) 于Thu Jan 6 10:13:19 2005)
提到:
这个居然mark了?
不是误人子弟吗?
那段英文说的倒是没错的,"翻译一个术语真的需要对这个行业的中文和英文非常懂才行。
"也没错,其他都错了
bias和model complexity, representation ability完全是不同的东西。

jueww (觉·Hayek) 于Thu Jan 6 13:06:18 2005)
提到:
是不一样啊。但我觉得就是差不多的东东。
本质想谈的都是模型的推广能力,
同一个东西换个角度表达的概念。
只不过bias跟具体分类算法相关时可以说得更加清楚点。
但如果是抽象的谈bias,
我确实没理解bias比model representation ability多了什么新东西,
请指教。
the inductive bias of a machine learning algorithm refers to additional assum
ptions, that the learner will use to predict correct outputs for situations th
at have not been encountered so far.
这个additional assumption我理解的就是模型的表达能力,只不过
bias是相对于learning algorithm上来说的,
而representation是相对于classification model来说的。
mitchell、dietteriech喜欢用bias,而vapnik喜欢用model complexity。

faiut (繁星满天) 于Thu Jan 6 22:21:10 2005)
提到:
本来概念迷迷糊糊的,现在看了你的介绍豁然开朗。
3x

jueww (觉·Hayek) 于Thu Jan 6 22:28:13 2005)
提到:
呵呵。相互帮忙,何乐不为啊。再说真正搞过一样东西的人,
都会碰到一样的、很多书上没有的东西的。。。只能靠自己领会了。
搞开发是这样,搞所谓的研究估计也这样。

ihappy (人似秋鸿来有信) 于Fri Jan 7 01:04:02 2005)
提到:
其实mitchell那本书这个部分讲的很好啊。
首先,他举了一个例子,说明任何bias-free的learner都是fruitless,不能用来
对任何unseen sample进行分类。换句话说,就是说,没有bias的learner没有任何
generalizability。 这个和model complexity是不同的,如果选择了不合适的
model complexity,只是可能泛化能力变差而已,仍然有泛化能力。
所以,这个所谓的inductive bias是your PRIOR assumption about the learner.
这里英文用bias这个词是合适的,至于中文应该翻译成什么,我自己也没有找到
什么合适的,似乎目前知道的,偏置这个翻译可以用。
第二,inductive bias和occam razor有很大关系,因为通常大家的prior assumption,
就是inductive bias,会选择occam razor,或者说,选择合适的complexity比较小的
model,但是这两者并不等价。比如说candidate elimination的inductive bias是
解存在(或者说version space不为空),decision tree的inductive bias是短
的树(这个近似于model complxity),以及高information gain的属性位置偏高
(这个就不是model complexity)
第三,inductive bias主要是个概念,实用性很差--除了有限的几种简单learner,
几乎没法说明其他learner的inductive bias是什么,而且对实际应用指导性很差。
但是对于machine learning的研究人员来说,这个概念是必须搞清楚的--以及他
和model complexity的区别

jueww (觉·Hayek) 于Fri Jan 7 01:23:55 2005)
提到:
领教了。不过还是不懂,也不觉得需要懂。。。
当文献中用bias指向不同的分类器并进行比较时,我理解就是意在
比较它们之间complexity,representation ability,generalization ability,而你觉
得这些例子并不指它们在不同分类器之间比较。但现实是文献中就是用bias来泛指各种
分类器。
下面是一篇文献的题目和摘要。如果是prior,还能control吗?反而model complexity来
代替的话,就很好理解了。
Control of inductive bias in supervised learning using evolutionary computatio
n: a wrapper-based approach
Source Data mining: opportunities and challenges table of contents
Pages: 27 - 54
Year of Publication: 2003
ISBN:1-59140-051-1
Author William H. Hsu Kansas State University

In this chapter, I discuss the problem of feature subset selection for supervi
sed inductive learning approaches to knowledge discovery in databases (KDD), a
nd examine this and related problems in the context of controlling inductive b
ias. I survey several combinatorial search and optimization approaches to this
problem, focusing on data-driven, validation-based techniques. In particular,
I present a wrapper approach that uses genetic algorithms for the search comp
onent, using a validation criterion based upon model accuracy and problem comp
lexity, as the fitness measure. Next, I focus on design and configuration of h
igh-level optimization systems (wrappers) for relevance determination and cons
tructive induction, and on integrating these wrappers with elicited knowledge
on attribute relevance and synthesis. I then discuss the relationship between
this model selection criterion and those from the minimum description length (
MDL) family of learning criteria. I then present results on several synthetic
problems on task-decomposable machine learning and on two large-scale commerci
al data-mining and decision-support projects: crop condition monitoring, and l
oss prediction for insurance pricing. Finally, I report experiments using the
Machine Learning in Java (MLJ) and Data to Knowledge (D2K) Java-based visual p
rogramming systems for data mining and information visualization, and several
commercial and research tools. Test set accuracy using a genetic wrapper is si
gnificantly higher than that of decision tree inducers alone and is comparable
to that of the best extant search-space based wrappers.

时间: 2024-10-12 12:23:38

对Inductive Bias(归纳偏置)的理解的相关文章

机器学习入门 - 1. 介绍与决策树(decision tree)

机器学习(Machine Learning) 介绍与决策树(Decision Tree) 机器学习入门系列 是 个人学习过程中的一些记录与心得.其主要以要点形式呈现,简洁明了. 1.什么是机器学习? 一个比较概括的理解是: 根据现有的数据,预测未来 2.核心思想 : Generalization 可以理解为,归纳.概括.就像是人的学习一样,找出一件事物与与一件事物的联系 3.归纳性的机器学习(Inductive machine learning) 其核心思想是使用训练数据,并从其中摸索出一套适用

机器学习基础知识整理归纳

关于机器学习的一些基本概念的整理 1.前言 1.机器学习是一门致力于研究如何通过计算的手段,利用经验来改善系统自身的性能的学科.1997年Mitchell给出一个更形式化的定义,假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习. 机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型"的算法,即学习算法(learning algorithm)."数据"即是现实生活中的&

浅谈神经网络中的bias

1.什么是bias? 偏置单元(bias unit),在有些资料里也称为偏置项(bias term)或者截距项(intercept term),它其实就是函数的截距,与线性方程 y=wx+b 中的 b 的意义是一致的.在 y=wx+b中,b表示函数在y轴上的截距,控制着函数偏离原点的距离,其实在神经网络中的偏置单元也是类似的作用. 因此,神经网络的参数也可以表示为:(W, b),其中W表示参数矩阵,b表示偏置项或截距项. 2.bias的计算方式? 神经网络结构中对偏置单元的计算处理方式有两种, 

《机器学习》第二章 概念学习和一般到特殊序

2.1.简介 布尔函数一般形式:F(b1, b2, ..., bn),其中 bi的定义域为{0,1},F的值域为{0, 1}. 在一般的定 义域上的,取值在 {0, 1} 中的函数也叫做布尔值函数概念学习定义中的布尔函数指定就这个,主要是 规定学习的问题目标是布尔的,反应在上面的样本中,就是Yes或者No.目标函数的形式如下: f: X->{0,1} 概念学习:是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数.[很明显概念学习属于 监督学习的分类问题] 另外一种定义:给定一样例集合以及

[译]深度神经网络的多任务学习概览(An Overview of Multi-task Learning in Deep Neural Networks)

译自:http://sebastianruder.com/multi-task/ 1. 前言 在机器学习中,我们通常关心优化某一特定指标,不管这个指标是一个标准值,还是企业KPI.为了达到这个目标,我们训练单一模型或多个模型集合来完成指定得任务.然后,我们通过精细调参,来改进模型直至性能不再提升.尽管这样做可以针对一个任务得到一个可接受得性能,但是我们可能忽略了一些信息,这些信息有助于在我们关心的指标上做得更好.具体来说,这些信息就是相关任务的监督数据.通过在相关任务间共享表示信息,我们的模型在

几种分类问题的区别:多类分类,多标签分类,多示例学习,多任务学习

多类分类(Multiclass Classification) 一个样本属于且只属于多个类中的一个,一个样本只能属于一个类,不同类之间是互斥的. 典型方法: One-vs-All or One-vs.-rest: 将多类问题分成N个二类分类问题,训练N个二类分类器,对第i个类来说,所有属于第i个类的样本为正(positive)样本,其他样本为负(negative)样本,每个二类分类器将属于i类的样本从其他类中分离出来. one-vs-one or All-vs-All: 训练出N(N-1)个二类

PGM:贝叶斯网络与朴素贝叶斯网络

http://blog.csdn.net/pipisorry/article/details/51471222 贝叶斯与频率派思想 频率派思想 长久以来,人们对一件事情发生或不发生,只有固定的0和1,即要么发生,要么不发生,从来不会去考虑某件事情发生的概率有多大,不发生的概率又是多大.而且事情发生或不发生的概率虽然未知,但最起码是一个确定的值. 比如如果问那时的人们一个问题:"有一个袋子,里面装着若干个白球和黑球,请问从袋子中取得白球的概率是多少?"他们会立马告诉你,取出白球的概率就是

机器学习游记(一)

机器学习是目前信息技术中最激动人心的方向之一,其应用已经深入到生活的各个层面且与普通人的日常生活密切相关. 一.定义 正如我们人类根据过去的经验来判断明天的天气,购买适合自己的东西,做出有效的预判,那能不能让计算机帮助人类来实现这个呢? 机器学习正式这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能.在计算机系统中,"经验"通常以"数据"形式存在,因此,机器学习所涉及的主要内容是关于在计算机上从数据中产生"模型"(mode

关于模型

一.基本 1.模型也被称为学习器,学习器更为准确.学习器是指能从已有的数据中学习到所需知识的数学模型. 2.模型分类:按照学习的数据分类, (1)监督学习(supervised learning):训练的数据有标记信息.又由标记信息的 [1]分类:标记信息呈现离散状态.KNN.朴素贝叶斯.逻辑回归.随机森林.支持向量机.决策树.神经网络 [2]回归:标记信息呈现的是连续值.线性回归.Adaboost.Gradient Boosting.神经网络 (2)无监督学习(unsupervised lea