计算和理解平均数:
- 计算均值(算数平均数)
均值是计算平均数最常用的形式。等于数组中所有数值的总和除以该数组值的个数。
- 计算加权平均数
简单计算的均值,如果出现极端值的情况,并不能反映整体数据的均值,那么我们就需要采用加权平均数。
加权平均数:每一数值乘以它出现的频数,并将所有的积相加,然后除以频数的总和。
1)列出要计算均值的样本的所有数值。
2)列出每一个值出现的频数。
3)每一数值乘以它的频数
4)计算“数值*频数”列的所有数值总和。
5)除以频数的总和。
- 计算中位数
中位数定义为一系列数据的中点,中位数没有标准公式。
1)以从小到大或者从大到小的顺序列出数据
2)找到位于中间位置的数据。那就是中位数。
均值是一系列数值的中间点,而中位数是一系列个体的中间点。
因为中位数关注的是有多少个体而不是这些个体的数值,极值就不会产生影响。
- 计算众数
众数是最笼统、最不精确的集中趋势量数。但是在理解特定的数据集的特征中扮演着非常重要的角色。
众数就是出现次数最多的数值。仍然没有计算公式
1)列出一个数据分布中的所有数值,但是每一个数值只列出一次。
2)计算每个数值出现的次数。
3)出现次数最多的就是众数。
何时使用那种测试类型:
- 如果数据属性是分类的,而且数值中只属于一种类型,例如头发颜色、政治背景、邻里位置和宗教,就使用众数。这种情况下各个分类之间是互斥的。
- 如果数据中包含而且你不想扭曲平均数就是用中位数,例如收入。
- 最后,如果数据不包括极值也不是分类数据就使用平均数,例如考试成绩或游五十码需要的时间。
时间: 2024-10-18 00:46:45