七周成为数据分析师07_统计学基础

拿到数据之后,我们应该怎么做?

直接套用各种图表公式进行分析并不是一个好做法。因为众多分析思路和公式都是基于数据服从一定分布的前提,如果不了解数据质量和分布情况,做推断分析是事倍功半的。

正确的处理方法是先使用描述统计

描述统计学

描述统计学是一种概括数据集的方式,包括数据的加工和显示,数据集的分布特征等。它与推断统计相呼应。

首先把数据分为分类数据和数值数据。二者最显著的区分在于分类数据不可做加减,而数值数据可以。

分类数据主要应用频数统计,对各分类数据进行计数。

数值数据则是描述统计的重点。

数据的度量

1. 平均数:平均数容易受到极值的影响,进而“被平均”

2. 中位数:处于数据排序后最中间的数值

3. 众数:众数使用的频次较低,更多用于分类数据中

4. 四分位数:将数据排序后划分为四等分,能辅助衡量数据的分布状态。其中第二四分位数(Q2)即中位数

5. 方差:描述数据的离散程度

方差越大,说明数据的波动越大,数据集的离散程度越大。

Excel中,总体方差:VARP(), 样本方差VAR()

6. 标准差:方差的开平方

标准差同方差衡量的意义一致,但标准差更容易与平均数等指标进行度量。

Excel 中,总体标准差为:stdevp(),样本标准差为stdev()

7. 数据标准化 Z-Score

Z-Score是数据标准化的一种,它将一组数据转化为均值为0标准差为1的标准正态分布。

标准化有助于不同量纲间的数据进行比较,和助于清晰展现一组数据间的变化

8. 切比雪夫定理

至少有75%的数据,位于[μ-2σ, μ+2σ]内

至少有89%的数据,位于[μ-3σ, μ+3σ]内

至少有96%的数据,位于[μ-5σ, μ+5σ]内

七周成为数据分析师的课程,还有最后一周属于 Python 相关基础知识。因为个人已经有 Python 基础知识,也已经使用 Python 这门语言一段时间了,就不对它再做一些笔记。

相关的文字资料可以查看:

如何七周成为数据分析师22:用pandas进行数据分析实战

如何七周成为数据分析师21:Python分析之numpy和pandas入门

原文地址:https://www.cnblogs.com/xingyucn/p/10404290.html

时间: 2024-10-29 19:08:06

七周成为数据分析师07_统计学基础的相关文章

七周成为数据分析师—Excel函数篇

原文链接 摘要: 本文是<七周成为数据分析师>的第一篇教程,如果想要了解写作初衷,可以先行阅读七周指南.温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分. 世界上的数据分析师分为两类,使用Excel的分析师,和其他分析师. 本文是<七周成为数据分析师>的第一篇教程,如果想要了解写作初衷,可以先行阅读七周指南.温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分. 世界上的数据分析师分为两类,使用Excel的分析师,和其他分析师.每一个数据新人

七周成为数据分析师01_数据分析思维

在学习数据分析知识的过程中发现了一个七周成为数据分析师课程班,讲解的比较基础和全面,相对于常见的一些数据分析课程,突出的优点在于它把重心放在了数据分析的思维和业务能力,更加符合实际需求.毕竟对于数据分析师来说,最难的地方在于思维业务能力,否则只会使用各种各样炫酷的软件代码而不知所措. 这里记录一下七周成为数据分析师课程的学习笔记,教学视频是在万能的b站上发现的.可能涉及到版权原因这里就不贴上链接. 对应的文字教学资料可以查看:互联网数据分析能力的养成,需一份七周的提纲--秦路 接下来是第一周的课

七周成为数据分析师05_数据可视化

数据可视化之美 数据可视化的目的是为了让数据更高效,让读者可以更高效阅读,而不单是自己使用. 数据可视化首先需要突出数据背后的规律和重要因素,其次才是美观. 数字可视化应该基于实际业务背景,比如地铁线路图并没有按照真实的地理距离来划分,但它却准确直观的传递给用户最关注的重点:应该如何乘车才能到达某地. 图表绘制部分主要为实操,这里就不做分享.原课程可以参考如下链接: 如何七周成为数据分析师:Excel技巧之甘特图绘制(项目管理) 图表的基本概念 1. 维度和度量 首先需要对维度和度量的概念进行区

七周成为数据分析师04_Excel

Excel适用于敏捷.快速.需要立即响应的需求: 而 Python.BI 等适用于常规.频繁.可复用可工程化的需求 设计到 Excel 的内容主要需要进行实操练习,这里只做一个陈列,具体知识请参考: 如何七周成为数据分析师01:常见的Excel函数全部涵盖在这里了 如何七周成为数据分析师02:Excel技巧大揭秘 如何七周成为数据分析师03:手把手教你Excel实战 1. Excel 常用的函数 1)文本清洗类 2)关联匹配类 3)逻辑运算类 4)计算统计类 5)时间序列类 原文地址:https

七周成为数据分析师02_业务分析指标

成为一名合格的数据分析师,业务知识很重要.光有分析技巧但没有业务知识支撑,分析出的结果也只会是空中楼阁,难以落地推行. 只有理解业务,才能建立业务数据模型. 经典的业务分析指标 指标:如果你不能衡量它,你就无法增长它. 将业务场景用指标来衡量,更有利于对业务知识的把握. 指标建立的要点: 建立核心指标(明确当前核心需求) 好的指标应该是比率 好的指标应该能带来显著效果(易于执行落地) 好的指标不应该虚荣(纯粹为了数字好看,没有考虑实际情况) 好的指标不应该很复杂(直接干净简单利落) 1. 市场营

七周成为数据分析师03_业务分析框架

如何建立业务分析框架 从指标的角度出发 从业务的角度出发 从流程的角度出发 1. 市场营销模型 以'潜在客户-机会客户-新客-老客-忠诚客户'为主轴进行扩展. 以"机会客户"为例,可对其进行结构化思维划分: 2. AARRR 模型 付费推广渠道,先下载再注册:社交传播渠道,先注册再下载. 以"二次激活"为例进行扩展: 3. 用户行为模型(内容平台) 4. 电子商务模型 5. 流量模型 6. 如何应对各类业务场景 多加练习 熟悉业务 应用三种核心思维 归纳和整理出指标

数据分析师必备的基础知识

  古人云:"万变不离其宗",说明基本技术是相当重要.这里的术更多是(计算机.统计知识), 多年做数据分析.数据挖掘的经历来看.以及业界朋友的交流来看,这点大家深有感触的. 1.数据库查询-SQL 数据分析师在计算机的层面的技能要求较低,主要是会SQL,因为这里解决一个数据提取的问题.有机会可以去逛逛一些专业的数据论坛,学习一些SQL技巧.新的函数,对你工作效率的提高是很有帮助的. 2.统计知识与数据挖掘 你要掌握基础的.成熟的数据建模方法.数据挖掘方法.例如:多元统计:回归分析.因子

第一周:数据分析师思维

一,前言 思维缺失---造成"不知道,不确定"(问题发生没?问题在哪里?为什么?不确定对不对?不确定执行结果?不知道老板是否满意给不给加薪?....) 要拥有三种核心思维: 结构化 公式化 业务化 数据分析思维7大技巧:1.象限法 2.多维法 3.假设法 4.指数法 5.二八法则 6.对比法 7.漏斗法 在业务时间锻炼分析能力----好奇心 二,三种思维详细内容 1.结构化 重点:找出核心论点,将核心论点逐一分解,再去拆解到穷尽(金字塔塔顶到塔底部) 工具:单人作战----思维导图 团

3个月零基础入门数据分析师是一件完全可能的事

统计学无需置疑是一个数据分析师的核心功底,你只有学好了统计学才能谈得上数据分析. 但是统计学又常常是不够用的,我们还需要一些高级的模型来解决我们实际业务中的问题,比如:银行需要判断是否给某个客户发放信用卡 这就需要一个高级的二分类模型.这里我们的数据挖掘理论就派上用场了. 有了理论知识,我们需要用工具去实现我们的理论并加以应用.这个年代,已经没有人会去手工计算某个问题了,R和PYTHON就是最负盛名的数据分析工具. 关于R和PYTHON的地位,题主可以百度,谷歌,知乎等搜索一遍. 如果致力于在互