数据挖掘:数据(数据对象与属性类型)

一、概述

  1. 现实中的数据一般有噪声、数量庞大并且可能来自异种数据源。
  2. 数据集由数据对象组成,一个数据对象代表一个实体。
  3. 数据对象:又称样本、实例、数据点或对象。
  4. 数据对象以数据元组的形式存放在数据库中,数据库的行对应于数据对象,列对应于属性。
  5. 属性是一个数据字段,表示数据对象的特征,在文献中,属性、维度(dimension)、特征(feature)、变量(variance)可以互换的使用。
  6. “维”,一般用在数据仓库中。
  7. “特征”,一般用在机器学习中。
  8. “变量”,一般用在统计学中。
  9. 一个属性的类型由该属性可能具有的值的集合决定,可以是标称的、二元的、序数的、数值的。

二、标称属性(nominal  attribute)

 1)特点

  1. 标称属性的值是一些符号或事物的名称。
  2. 每个值代表某种类别、编码、状态,因此标称属性又被看做是分类的(categorical)。
  3. 标称属性的值不具有有意义的序,而且不是定量的。(也就是说,给定一个对象集,找出这种属性的均值没有意义)

 2)其它

  1. 这些值不必具有有意义的序,在计算机科学中,这些值也被看做是枚举的(enumeration)。
  2. 尽管标称属性的值是一些符号或“事物的名称”,但也可以用数表示这些符号或名称,如 hari_color,可以用 0 表示黑色,1 表示黄色。
  3. 但一种属性中最长出现的值,称为众数(mode),是一种中心趋势度量。

  # 例:hari_color(头发颜色)、marital_status(婚姻状况)、occupation(职业),都是标称属性,表示对象的特征。

三、二元属性(binary  attitute)

 1)特点

  1. 二元属性是一种标称属性,只有两个状态:0 或 1,其中 0 通常表示该属性不出现,1 表示出现。
  2. 二元属性又称布尔属性,如果两种状态对应的是 true 和 false。

 2)其它

  1. 对称的二元属性:如果两种状态具有同等价值,并且携带相同权重,如表示性别,则 0 和 1 分别表示男性或女性没有影响。
  2. 非对称的二元属性:两种状态的结果不是同等重要的,如 HIV 患者和不是 HIV 患者,为了方便计,将用 1 对最重要的结果(通常是稀有的)编码(如,HIV 患者),而另一个用 0 编码。

四、序数属性(ordinal  attribute)

 1)特点

  1. 属性对应的可能的值之间具有有意义的序或秩评定(ranking),但是相继值之间的查是未知的。(也就是对应的值有先后次序)

 2)其它

  1. 例:drink_size,表示饮料杯的大小:小、中、大,这些值具有有意义的先后次序。
  2. 序数属性可以通过把数值量的值域划分成有限个有序类别(如,0-很不满意、1-不满意、2-中性、3-满意、4-很满意),把数值属性离散化而得到。
  3. 可以用众数和中位数表示序数属性的中性趋势,但不能定义均值。
  4. 标称、二元和序数属性都是定性的,即,它们描述对象的特征,而不给出实际大小或数值。

五、数值属性(numeric  attribute)

  • 特点
  1. 是定量的可度量的量,用整数或实数表示。
  2. 可以是区间标度的或比率标度的。

 1)区间标度(interval-scaled)属性

  • 例:temperature(温度)属性,一般表示:10℃~15℃。
  • 特点:
  1. 用相等的单位尺度度量,区间属性的值有序,可以为正、0、负。(值的秩评定)
  2. 允许比较与定量评估值之间的差。
  3. 区间标度属性是数值的,中心趋势度量中位数和众数,还可以计算均值。

 2)

原文地址:https://www.cnblogs.com/volcao/p/10080736.html

时间: 2024-10-13 13:39:17

数据挖掘:数据(数据对象与属性类型)的相关文章

对象的属性类型详解

对象的属性类型,描述了属性(property)的各种特征. ECMAScript中有两种属性类型:数据属性和访问器属性. 1. 数据属性. 数据属性包含一个数据值的位置.在这个位置可以读取和写入值.数据属性有4个描述其行为的特性: [configurable]: 表示能否通过delete删除属性从而重新定义属性,能否修改属性的特性,或者能否把属性修改为访问器属性. [enumerable]: 表示能否通过for-in循环返回属性. [writable]: 表示能否修改属性的值. [value]:

Javascript学习笔记:对象的属性类型

在ECMAScript中有两种属性:数据属性和访问器属性 1.数据属性 configurable:表示能否通过delete删除属性从而重新定义属性:或者能否修改属性的特性:或者能否把属性修改为访问器属性. enumerable:表示能否通过for-in循环返回属性. writable:表示能否修改属性的值. value:包含这个属性的数据值,读取属性的时候,从这个位置读:写入属性的时候,把新的值保存在这个位置. 2.访问器属性 configurable:表示能否通过delete删除属性从而重新定

对象的属性类型

对象属性有两种 数据属性 访问器属性 数据属性:有四个特性 [[configurable]](代表属性是否可配置):当这个属性描述符值为true时,该属性可能会被改变,也可能会被从相应的对象删除,默认为false. [[enumerable]](代表属性是否可枚举):表示能否通过for - in循环返回属性,默认为false. [[value]](代表属性值):包含这个属性的数据值,读取属性值的时候,从这个位置读:写入属性时,把新的值保存在这个位置,默认为undefined. [[writabl

Javascript之对象的属性类型

ECMA-262第5版在定义只有内部才用的特性时,描述了属性的各种特征.ECMA-262定义这些特性是为了实现Javascript引擎用的,因此在JavaScript中不能直接访问它们.为了表示特征是内部值,该规范把它们放在了两对方括号中,例如[[Enumberable]].尽管ECMA-262第3版的定义有些不同,但本书只参考第5版的描述. ECMAScript中有两种属性:数据属性和访问器属性. 数据属性 数据属性包含一个数据值的位置.在这个位置可以读取和写入值.数据属性有4个描述其行为的特

数据挖掘-认识数据

数据对象与属性类型 数据集由数据对象组成.一个数据对象代表一个实体.例如销售数据库中,对象可以是顾客.商品.属性是一个数据字段,表示数据对象的一个特征. 属性类型 标称属性(nominal attribute):一些事物的名称,每个值代表某种类别.编码或者状态.不具有有意义的序,不是定量的,其均值和中位数无意义,总数有意义.例如,颜色这个对象的属性可能有黑色.红色.白色等,职业可能值有教师.医生等. 二元属性(binary attribute):一种标称属性,只有两个类别或状态:0或1.有对称和

EBS OAF开发中实体对象和视图对象的属性设置器

(版权声明,本人原创或者翻译的文章如需转载,如转载用于个人学习,请注明出处:否则请与本人联系,违者必究) 源文: Home > Oracle Application Framework Documentation Set, Release 12.2 > Oracle Application Framework Developer's Guide > Chapter 5: Implementing Server-Side Features > Entity Object and Vi

fastreport对象的属性和方法

对象的属性和方法 报表的报表可视对象都是TfrView的继承类.在脚本中可以使用下列属性和方法: 属性 类型 描 述 BandAlign Integer 设置对象在band中的位置. 可选值:baNone, baLeft, baRight, baCenter, baWidth, baBottom. Enabled Boolean 确定对象是否响应事件.可选值:True, False. FillColor Integer 对象的背景颜色.颜色一般设为常量clXXX. FrameColor Inte

03-对JQuery对象的属性,特性以及数据的操作

对JQuery对象的属性,特性以及数据的操作: 特性(attributes)和属性(properties): 特性的值是字符串. 属性的值不光为字符串,而且可以为布尔值,对象,数字. 元素的属性和特性有动态链接,如果特性在dom对象中存在,其中一个发生变化,另一个也会变化 如果特性是本来就在dom对象中存在,但是类型为boolean,那么特性和属性将不会同步. 如果attributes不是dom对象内建的属性,attributes和properties的值不会同步. 操作元素的特性: 获取特性的

WCF中数据契约之已知类型的几种公开方式

WCF中传输的数据不想传统的面向对象编程,它只传递了一些对象的属性,但是自身并不知道自己属于什么对象,所以,他没有子类和父类的概念,因而也就没有Is-a的关系,所以在WCF中,如果想维持这种继承关系,就需要做一些特殊的处理了. 假设有如下定义, namespace KnownTypeExampleInterface{    [DataContract]    public class Employee    {        [DataMember]        public string N