数据的基本概念

数据集:数据对象的集合

属性(attribute)是对象的性质或特性,它因对象而异,或随时间而变化。

测量标度(measurement scale)是将数值或符号值与对象的属性相关联的规则(函数)

属性的不同类型:

  标称:标称属性的值仅仅只是不同的名字,即标称值只提供足够的信息以区分对象。比如:邮政编码,雇员ID,性别。对标称属性的操作有众数,熵,列联相关等。

  序数:序数属性的值提供足够的信息确定对象的序。比如:街道号码,成绩,产品质量(优秀,合格,不合格)。对序数属性的操作有中值,百分位等。

  区间:对于区间属性,值之间的差是有意义的,即存在测量单位。比如:日历日期,摄氏或华氏温度。操作:均值,标准差,皮尔逊相关等。

  比率:对于比率变量,差和比率都是有意义的。比如:绝对温度,货币量。操作:几何平均,调和平均等。

数据集的类型:

  维度:数据集的维度是数据集中的对象具有的属性数目。

  分辨率:常常可以在不同的分辨率下得到数据,并且在不同的分辨率下数据的性质也不同。

  

时间: 2024-10-22 01:44:19

数据的基本概念的相关文章

mysql数据引擎的概念介绍

什么是数据库引擎?每种数据库的数据格式,内部实现机制都是不同的,要利用一种开发工具访问一种数据库,就必须通过一种中介程序,这种开发工具与数据库之间的中介程序就叫数据库引擎. 如果你是个赛车手并且按一下按钮就能够立即更换引擎而不需要把车开到车库里去换,那会是怎么感觉呢?MySQL数据库为开发人员所做的就好像是按按钮换引擎:它让你选择数据库引擎,并给你一条简单的途径来切换它. MySQL 的自带引擎肯定是够用了,但是在有些情况下,其他的引擎可能要比手头所用更适合完成任务.如果愿意的话,你甚至可以使用

大数据仅仅是概念还是有实用性

从去年开始,不管是互联网行业还是其他行业,“大数据”一词开始频繁出现. “概念”性质的东西在中国的互联网圈子总是可以快速传播,这里面有很多原因,其中就有整体氛围所致:大多数互联网的创业者都是希望通过前瞻性的创新来改变世界,受到资本追捧,最终套现.在这个过程中,概念飞快的传播.包装,成为各种打着标签的产品.而实用主义者只被动接受,缺乏正确认知深刻的探索. 从下图可以看出,2008年大数据概念开始传播后,在百度和Google的“大数据”和“Big Data”的检索趋势(下图数据中Baidu的PV加权

数据机构-基本概念

百度版: 数据结构是计算机存储.组织数据的方式.数据结构是指相互之间存在一种或多种特定关系的数据元素的集合.通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率.数据结构往往同高效的检索算法和索引技术有关. 数据结构里面的一些重要概念: 1.逻辑结构与物理结构 1.1逻辑结构(重点) 指反映数据元素之间的逻辑关系的数据结构,其中的逻辑关系是指数据元素之间的前后件关系,而与他们在计算机中的存储位置无关.(百度版) 主要有几种关系: 集合关系: 集合关系的数学图示: 线性关系:两个变量之间存

STM32_Flash做为存储器储存数据(基本概念)

摘自:http://bbs.elecfans.com/jishu_388272_1_1.html 说到STM32的FLSAH,我们的第一反应是用来装程序的,实际上,STM32的片内FLASH不仅用来装程序,还用来装芯片配置.芯片ID.自举程序等等.当然, FLASH还可以用来装数据. PS:自己收集了一些资料,现将这些资料总结了一下,不想看的可以直接调到后面看怎么操作就可以了. FLASH分类      根据用途,STM32片内的FLASH分成两部分:主存储块.信息块. 1.主存储块用于存储程序

每天进步一点点——形象化描述数据结构中基本概念

基本数据结构: 村名信息表.学生成绩表等抽象成线性表: 一个家族关系.一个机构可抽象成树: 一个群体中个体之间的关系.城市之间的交通网络抽象成图: 人们也将村名信息表.学生成绩表.家族关系.一个机构.群体中个体之间的关系.城市之间的交通网络称为数据: 成绩表中每个数据元素(表中一行)包括学号.姓名.成绩.备注等4个数据项.(数据项是组成数据的最小单位) 特殊的线性结构: 栈:桌上的一叠书,最上面的一层(栈顶) 队列:排在队头的人买好票离开,新来的人在队尾入队 指针用来识别不同存储单元的数字编码,

数据机构基本概念

一 数据机构类型: 集合 ,线性结构,树形结构,图状机构 二 逻辑关系:线性结构 和 非线性结构 线性结构 1.线性表 2.栈 3.队列 4.数组 ,广义表 5.字符串 非线性结构 1.树,二叉树 2.图 三 数据存储结构 顺序存储结构(向量,一维数组) 非顺序存储结构(链接表) 四 数据类型(Data Type) 原子类型 (如 int, char, float等) 机构类型(线性表, 数组, 树等) 五 抽象数据类型(Abstruse Data Type) 抽象线性数据结构是指一个数字模型以

一些数据相关的重要概念

马上要开始数据相关的工作了,但是有时候会自觉不自觉的对一些最近火热的概念有些不太清晰的地方,所以在此整理一下这些概念,希望在以后的工作学习过程中,能结合自己的感受,不断进行完善. 大数据:(概念.实现.)数据采集.数据挖掘.数据清洗 深度学习: 机器学习: 自然语言处理:

机房-数据中心-概念介绍

数据中心的概念:在一个物理空间内实现信息的集中处理.存储.传输.交换.管理 关键设备:计算机设备.服务器设备.网络设备.存储设备等                  机房工程(数据中心)的类型表 计算机机房 银行(人民银行.邮储银行) 电信机房 网络运营商(电信.联通.移动) 控制机房 IT运营商(百度.阿里.腾讯.世纪互联) 屏蔽机房等 超算中心(中航.清华.航天部)     数据中心的发展趋势 如何设计一个数据中心 设计目的:高效率.低成本 预算:一般房地产按照每平方米计算价格(空间成本>基

Kubernetes核心概念之Volume存储数据卷详解

在Docker中就有数据卷的概念,当容器删除时,数据也一起会被删除,想要持久化使用数据,需要把主机上的目录挂载到Docker中去,在K8S中,数据卷是通过Pod实现持久化的,如果Pod删除,数据卷也会一起删除,k8s的数据卷是docker数据卷的扩展,K8S适配各种存储系统,包括本地存储EmptyDir,HostPath,网络存储NFS,GlusterFS,PV/PVC等,下面就详细介绍下K8S的存储如何实现. 一.本地存储 1,EmptyDir ①编辑EmptyDir配置文件 vim empt