SPSSAU数据分析思维培养系列3:分析思路

本文章为SPSSAU数据分析思维培养的第3期文章。

上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用。拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应该做什么,需要有个宏观把控,只有这样才能有规范的研究科学的思维和逻辑。

本文章首先阐述数据的整体思维,即整体把控住应该如何剖析一份数据做到心理有数,接着针对常见的问卷进行思维剖析,并且提供思路框架,期许为大家带来一丝丝帮助。

第一部分 把控数据思维

如果想要把控好数据思维,简单来讲在拿到一份数据后如何进行分析,心里应该有个底。做到以下几点,相信可以更好地理解数据思维。首先是针对数据特征描述,其次是对数据质量说明,研究目的是什么如何使用研究方法或措施去匹配论证研究目的,最后把数据结果呈现出来并且进行讨论说明。

1、数据特征描述

拿到一份数据时,首先看下数据的特征,比如性别的分布情况如何,平均年龄情况如何。当然这里是需要区分定类和定量数据分别进行描述,比如性别是定类数据使用百分比频数说明,年龄是定量数据使用平均值或中位数进行描述说明,在‘数据分析思维培训之2’里面有详细说明。

为什么首先需要对数据特征进行描述呢?简单来讲,每份数据都有自己的background,研究是基本数据进行,首先需要告诉下别人我研究的数据是一群什么样的人或者物体。在此基础上才能进行后续的进一步分析。

如果研究群体出问题自然后续结论也会有问题,比如研究00后群体,但数据是基本80后,不同群体对于同一事情很可能有着不同的观点和态度。而且在最后进行说明讨论的时候也是基本样本群体的特征而进行,因此在数据分析时,通常首先需要描述清楚研究群体到底是什么样的。

2、数据质量说明

接着,一般需要对数据的质量进行说明,此步骤可以使用研究方法,比如信度分析组内相关系数ICC等等进行说明,但有时候数据不适合分析方法要求因而不能使用分析方法进行研究。此时正确的做法是详细描述清楚数据的来源,比如实验数据的背景情况下是什么,基于什么样的实验条件因素进行等,充分证明数据的质量可靠即可。形式不限,文字描述或者使用研究方法等均可。

3、研究目的剖析

对于数据基本特征和数据质量剖析后,接下来最关键的步骤是结合自己的研究目的进行。一般来说研究目的可分为两大类,一是差异关系研究;二是影响关系研究,以及其它。

比如不同性别群体是否吸烟的差异性,不同性别群体对于奢侈品的购买意愿或购买行为差异性。差异关系是一种常见且通用的研究方法,一般涉及到比如卡方分析、方差分析、T检验等,结合自己的数据类型进行选择使用即可。

而对于影响关系而言,更多出现于学术研究中,通过影响关系研究去论证观点的正确性,影响关系通常可使用比如线性回归、logistic回归、岭回归、Robust回归等。具体不同的研究方法可能对应着不同的数据类型,但都不复杂,关键的地方在于符合研究的目的。

有时候为了研究目的服务,可能还会对数据进行‘中间过程处理’,比如对于数据的信息浓缩,可使用因子分析等;或者对于样本群体的聚类,可首先进行聚类分析,然后聚类出不同类别群体再做后续的分析使用。研究目的通常是在准备数据之前就已经确定,因为先有思路再有数据的准备,最后才是进行分析。

4、数据结果呈现

在进行数据研究时,很可能需要对于数据结果进行呈现,通常是两种方式分别是表格和图。表格是通用的方式,但其比较‘枯燥’。因而很多时候需要结合数据情况进行可视化即图形展示。

一般针对定类数据的图形较多,比如饼图、条形图、柱形图,帕累托图,词云图等;而涉及到定量数据,由于其通过平均值进行表达描述,因而更多可能会使用比如折线图,簇状图等,当然如果是纯统计角度上,还可能的比如箱线图,散点图,直方图,PPQQ图等,均可在SPSSAU中快速的找到;分析与数据呈现是连在一起的,有了数据研究结论一定需要用某种形式呈现出来,无非是选择图或表,也或者二者均用;核心在于可以直观快速的呈现出结果。

可视化图形-spssau

数据分析思路事实上还有很多,比如模型的灵活运用,模型的选择使用等,同样的数据和研究目的,很可能使用到不同的研究模型,比如研究影响关系,都是定量数据。很可能会使用到线性回归、路径分析等,此时可结合实际情况,以及自身的理解综合评估即可,并无绝对对应关系。

第二部分 问卷量表思维参考

问卷数据是常见的一种数据来源,而且问卷中很多时候会使用到量表数据,针对此种量表数据,SPSSAU提供一种分析思路参考如下图:

量表数据问卷研究思路

其实从上表可知,第1和第2点均是对于数据特征进行描述。接着第4和第5点属于数据质量研究。第3点是为第6,7,8,9这4点服务。第6点是核心研究数据的特征描述。第7和第8点相关和假设分析属于影响关系的分析范畴。最后第9点是差异关系的范畴。

没有绝对的研究步骤,但从上图可以看到,基本上是先数据特征描述,接着数据质量分析,再接着核心研究数据的特征描述,进一步影响关系研究,最后差异关系研究。至于细节性问题,比如信度和效度分析谁先谁后,一般而言是信度在前效度在后。影响关系和差异关系谁先谁后呢?看研究目的,越重要的越放前,相对不重要的靠后即可。

第三部分 问卷非量表思维参考

针对非量表类问卷,非量表类问卷最大的特点是:非常多的单选题,多选题等,通常此类问卷用于政策现状研究、基本态度情况研究等。如果此类问卷,多数是使用频数分析,以及涉及多选题的几类方法;同时还有交叉卡方分析。

非量表分卷研究思路

思路上第1和第2点属于数据特征描述,先搞清楚研究数据的基本背景特征情况。接着对于核心研究项进行特征描述,即第3和第4点。除此之外还可以进行差异关系研究,即第5点,一般使用卡方分析。第6点影响关系研究一般会使用到logistic回归分析等。分析思路上紧密相联,先数据特征描述,核心变量特征描述,差异关系,影响关系研究,并且在最后进行汇总。

第四部分 其它

在数据分析思路上,还会有很多种类型,本文并没有提供到权重研究,事实上很多研究目的在于计算权重体系,当然此种情况目的非常清晰,主要奔着研究目的去就好,正常情况下都会使用到SPSSAU综合评价里面的研究方法。

综合评价方法

除了权重体系的构建,还有聚类数据,把数据样本群体分成几个类别等分析思路,先把思路确认好,接着大致就可以对应上正确的数据分析方法,准备好数据直接分析就可以。

更多涉及到数据思路上的资料可在SPSSAU手册里面找到参考,包括影响关系类研究,现状政策类研究,调节/中介类研究,实验类差异研究和聚类样本类研究共五类思路等。

原文地址:https://www.cnblogs.com/spssau/p/12652492.html

时间: 2024-08-28 06:58:10

SPSSAU数据分析思维培养系列3:分析思路的相关文章

数据分析思维培养之一:数据思维

本文章为SPSSAU数据分析思维培养的第一篇文章. 想要进行科学的数据分析,正确的数据格式,以及正常的数据是最基本的.而且数据的准备和数据的理解,正是科学的数据分析思维必备条件之一. 想要准备好自己的数据,需要从以下六个方面进行处理: 第1点,是需要准备好正确的数据格式 第2点,在于对数据的基本处理,包括数据标签.数据编码和生成变量等 第3点,是一些分析方法需要的数据特殊格式准备 第4点,是数据异常值,或者无效样本数据的处理 第5点,是数据基本特征探索 第6点,是一些其它注意事项等 第1点,数据

思维四:常用主题的商业分析思路分享

接着上一篇,如何设计商业仪表版的故事线,今天也为大家分享一下我们通常碰到的商业分析思路-销售主题.对于销售主题而言,最重要的就是业绩,那在分析中,我们如何通过数据来诠释业绩呢?业绩做了多少?做的好还是不好?有没有潜在的什么问题需要规避?这些问题的影响大不大呢?今天我们就围绕这如何解答这些问题,来设计一个仪表板. 首先,要回答这些问题,一定要有方法,而数据分析最常用也是最有效的方法就是计算和对比,计算也就是用DAX写度量值,但度量值不在于多,而在于重要,也就是大家通常所说的KPI-关键绩效指标,比

数据分析第二章确定分析思路

1. 常用的数据分析方法论 1)PEST分析法:PEST分析法用于对宏观环境的分析.对宏观环境因素作分析时,由于不同行业和企业有其自身特点和经营需要,分析的具体内容会有差异,但一般都应对政治(Political)经济(Economic)技术(Technological)社会(Social)这四大类影响企业的主要外部环境因素进行分析,这种方法简称为PEST分析法 2)5W2H分析法:why,what,who,when,where.how,how much 3)逻辑树:将问题的所有子问题分层罗列,从

码农的产品思维培养第2节----一个需求的奋斗史(人人都是产品经理)

今天我们继续坚持每日一节的产品思维培养,我喜欢在纸上画,喜欢做笔记.不是为了自己后面回去看,而是为了当时更好理解.不知道大家是否认同这点. 今天看到苏杰的一句话,其实和我之前讲过的是一致的,看来英雄所见略同,还是给大家分享一下"和学习任何领域的知识一样,建议大家在了解了知识框架之后,坚持"需求驱动学习"". 第二章,讲述的是一个需求的奋斗史.其实就是描述如何从用户那里得到需求,得到需求后如何处理的一个过程.今天,我们这一节讲如何从用户那里拿到需求. 用户研究,或者说

七周成为数据分析师01_数据分析思维

在学习数据分析知识的过程中发现了一个七周成为数据分析师课程班,讲解的比较基础和全面,相对于常见的一些数据分析课程,突出的优点在于它把重心放在了数据分析的思维和业务能力,更加符合实际需求.毕竟对于数据分析师来说,最难的地方在于思维业务能力,否则只会使用各种各样炫酷的软件代码而不知所措. 这里记录一下七周成为数据分析师课程的学习笔记,教学视频是在万能的b站上发现的.可能涉及到版权原因这里就不贴上链接. 对应的文字教学资料可以查看:互联网数据分析能力的养成,需一份七周的提纲--秦路 接下来是第一周的课

数据分析思维

数据分析思维 三种核心思维 结构化(树状) 1)概述 结构化是将‘思维如同乱麻’转换为 ‘清晰的思维图’. 摒弃‘想一点是一点’,减少时间浪费 结构化思想来自麦肯锡金字塔 2)如何将分析思维结构化 ①将论点归纳和整理 ②将论点递进和拆解 ③将论点完善和补充 3)金字塔的思考方式 ①核心论点 寻找金字塔的塔顶,它可以是假设,问题,预测,原因 也就是整个问题的核心 ②结构化拆解 自上而下,将核心论点层层拆解成分论点,上下之间成因果关系或依赖关系 ③MECE 相互独立,完全穷尽 论点之间无交集,所有论

多线程_java多线程环境下栈信息分析思路

导读:Java多线程开发给程序带来好处的同时,由于多线程程序导致的问题也越来越多,而且对问题的查找和分析解决对于菜鸟程序原来是是件头疼的事.下面我就项目中使用多线程开发程序过程中遇到的问题做详细的分析和解决思路的分享.本人也属菜鸟,忘大神指点. 项目描述: 工作中要编写一份程序用于爬取某某网站上的大量图片.从HBase里面遍历出所有的爬取任务,开启固定大小的线程池Executors.newFixedThreadPool(100),提交线程,线程每个线程做的事情是使用FileUtils.copyU

CPU利用率异常的分析思路和方法交流探讨

CPU利用率异常的分析思路和方法交流探讨在生产运行当中,经常会遇到CPU利用率异常或者不符合预期的情况,此时,往往暗示着系统性能问题.那么究竟是核心应用的问题?是监控工具的问题?还是系统.硬件.网络层面的问题?在上线前的测试过程中,经常会遇到新版本应用的CPU占用率比旧版本高,那么到底是新增的或者变更的什么模块导致呢?面对这种情况,我们应该如何定位和诊断问题的根本原因? 本期专题讨论会分享采用什么样的分析思路.分析方法和分析工具进行CPU使用情况的分析:并帮助大家解答以下问题: 1. CPU利用

第一次OllyDbg逆向记录(分析思路和注意点&其他文章)

OllyDbg 操作菜单栏.工具栏.快捷键 C++调用加强 目录 OllyDbg 操作菜单栏.工具栏.快捷键    1 一.    载入观察    1 1.静态载入观察:    1 2.OD动态观察    1 二.    初步尝试下断查找目标    1 1.如何下断    1 2.接下来有两个选择:    1 2.1手动F9运行目标    1 2.2设条件断点    1 2.3 CALL调用时堆栈小解    1 3.初步断点目标 (条件触发情况)    1 三.调用栈回溯    1 1.回溯到无