白话空间统计之四：P值和Z值（上）：零如果

本来今天想要讲讲软件操作的，后来发现好像还有好几个重要的指标没有说，干脆等所有说完在讲操作吧。否则操作出来的结果会发现大量的“不明觉厉”。

首先是空间统计里面非常神奇的两个值：P值和Z值。

要说这两个值之前。还是要复习一下统计学的概念。毕竟空间统计的理论基础还是建立在经典统计学上面的。

首先，统计学里面。有一个叫做“零如果”的概念很厉害，一定要说说。

零如果（null hypothesis），有时候又称原如果，官方的解释是：指进行统计检验时预先建立的如果。也就是说，你在检验你的结果之前。先对这些结果如果一个数值区间，这个区间通常是符合某种概率分布的情况。如果你的真实结果偏离了你设定的区间。就表示发生了小概率事件。这样你原来的如果就不成立了。

例如以下图所看到的：

如果你的计算结果落在-2到2之间，就表示你的如果是能够接受得。可是不在这个范围内，就说明消息小概率事件了。既然有小概率事件，就说明两种可能：1，你的如果有错误。2，出现了异常值。

这个奇妙的零如果有啥用呢？看以下这个样例：

我们来抛一枚硬币，（我发现统计学，特别是经典统计学最喜欢抛硬币了）。在丢之前，我们就已经设定了不管正反两面的概率都在50%左右。（实际上更接近48%——52%这个区间）那么假设我们丢出来的结果，出现了正面概率高达80%，而反面才出现了20%。那就是说。超出了我预设的范围，发生了小概率现象，那么这样的小概率现象就非常值得研究了，虾神个人觉得，假设出现了这样的情况，最大可能是这个硬币被做了手脚。

当然，还有可能是出现硬币竖立了起来这样的极小概率的事情……这样的就得归类到异常值里面去了。

（关于抛硬币的第二种思维方式，还能够看这篇文章：抛硬币的两种思维方式：

http://mp.weixin.qq.com/s?__biz=MzA4ODk4NzgyNA==&mid=200720156&idx=1&sn=564f0b6fe95276180c625373a7cea70f#rd

在经典统计里面，零如果觉得你统计计算的数据是符合某种概率的，那么在空间统计里面。零如果表示什么呢？

看以下这个样例：

假设说，A市在7月份发生了200起案件，理论上，不设定条件的话，这200起案件应该是平均的分布在A市的每一个区域的，可是实际上这是不可能的，我们会发现某些地区，案发率远远高于其它地区。

那么上面那个命题，最開始我们说明的，200起案件。平均分布在全市各个地方。就是所谓的“零如果”，在空间统计中，零如果指的就是空间位置在一定区域里面呈现全然随机（均匀）分布（在自然现象里面，均匀分布是极小概率才会出现的，基本上都能够忽略了。所以一般谈的就是全然随机）。

依照这种如果，我们就能够对整个城市的案件案发地点进行统计分析了，如果计算出来的结果，符合我们如果，那么就仅仅能说，这200起案件。发生的地点是随机的，没有聚集规律或者离散的规律。

在空间数据的分析中。有一个非常重要内容，就是知道数据分布是否有规律。

拿到一份数据的时候。第一时间，要了解的，就是这份数据是不是有规律。由于有规律的数据才干进行更好的分析。而假设你拿到的这份数据是一份随机分布的数据，那么一般来说，就没有啥分析研究的可能了。由于纯随机（全然随机）是无法预測也无法找到模式的，就像素数（素数在数轴上出现的位置就是全然随机的，无法找到不论什么规律和模式）。

所谓的纯随机。也有三种可能。一种是你的如果是纯随机的。二是你要计算的数据本身是纯随机的。第三就是你要计算的数据与其周边数据的关系是纯随机。

那么怎样对随机如果进行推断呢？也就是说。你的结果是接受零如果还是拒绝零如果。这样的就能够通过P、Z两种值的结果来帮助我们进行推断。

（未完待续）

时间： 2024-10-13 14:32:41

白话空间统计之四：P值和Z值（上）：零如果

白话空间统计之四：P值和Z值（上）：零如果的相关文章

白话空间统计之四：P值和Z值（上）：零假设

白话空间统计之四：P值和Z得分（中）

白话空间统计十四：高/低值的聚类（上）

白话空间统计之五：空间关系的概念化（上）

白话空间统计之：空间自相关

白话空间统计之：Moran's I（莫兰指数）

白话空间统计之：Moran&#39;s I（莫兰指数）

白话空间统计十五：多距离空间聚类分析 (Ripley's K 函数) （上）

白话空间统计之六：平均最近邻