数据分析笔记

1,信息几乎都是用于两个目的:操作型记录的保存和分析型决策的制定。简单说,操作性系统保存数据,而DW/BI系统使用数据。

2,

同比环比从定义上来说很简单,吴捷的答案说的很清楚了,我来补充一下两者的适用范围:
同比是今年的某个阶段与去年的相同时段比较,适用于观察某个指标在不同年度的变化,优势是可以去除大多数业务的季节因素,比如招聘,2月是淡季,3月是旺季,做3月的分析时用环比实际上体现出的是招聘市场的变化,而不是公司销售额的变化,用同比则可以看出今年的增长情况;劣势是灵活性较低,因为同比大多数以年为单位(否则就达不到去除季节因素的目标),不能反映出数据的短期大量变化。
环比是某个阶段与其上一个时长相等的阶段做比较,比如上周和本周,上月和本月,上季度和本季度等等,用于表示数据的连续变化趋势,优势是对于高速增长型业务,能非常好的体现出业务的增长趋势和事件的影响(典型如新开网站流量,UV第一周100,第二周300,第三周500,第四周做了个活动,2000,第五周1000,那么前三周网站的用户增长趋势很好,第四周数据有个突增,能看到活动带来的增长是很明显的),劣势是光看数字难以排除季节性因素,且对于稳定波动型数据(例如部门人数,每月有进有出,一年内的走势不明确,但部门规模又逐年扩大)来说,趋势不明显,环比意义相对小。

时间: 2024-08-08 02:18:19

数据分析笔记的相关文章

python数据分析笔记——数据加载与整理]

[ python数据分析笔记--数据加载与整理] https://mp.weixin.qq.com/s?__biz=MjM5MDM3Nzg0NA==&mid=2651588899&idx=4&sn=bf74cbf3cd26f434b73a581b6b96d9ac&chksm=bdbd1b388aca922ee87842d4444e8b6364de4f5e173cb805195a54f9ee073c6f5cb17724c363&mpshare=1&scene=

python数据分析笔记中panda(2)

1 将手机号码分开为运营商,地区和号码段 1 from pandas import read_csv; 2 3 df = read_csv("H:\\pythonCode\\4.6\\data.csv"); 4 5 6 #转换成字符数据 方便用slice 7 df['tel'] = df['tel'].astype(str); 8 9 #字符的抽取:根据已知列数据的开始和结束的位置 抽取新的列 slice(start,stop) 10 #运营商 11 bands = df['tel']

python数据分析入门学习笔记儿

学习利用python进行数据分析的笔记儿&下星期二内部交流会要讲的内容,一并分享给大家.博主粗心大意,有什么不对的地方欢迎指正~还有许多尚待完善的地方,待我一边学习一边完善~ 前言:各种和数据分析相关python库的介绍(前言1~4摘抄自<利用python进行数据分析>) 1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 (3)用于读写硬盘

读书笔记《网站数据分析》 如何查找网站存在的问题

按问题进行分类 查找网站存在的问题需要经过以下阶段 1.识别和描述问题 2.理清问题边界 3.收集客户需求 4.确定客户需求的关键质量特性 四个阶段中都要明确: 1.确定工作目标 2.清晰工作范围 3.做好利益相关方的沟通 4.项目风险评估 需要考虑的后续问题: 1.会不会导致后期不断返工 2.优化结果不被客户认可 _______________________ 识别问题和描述问题,首先得收集问题. 如何收集问题? 聚焦关注点: 1.业务拓展 2.了解业务拓展中遇到的问题 3.网站目标是否切合实

《深入浅出数据分析》笔记

刚准备转行数据分析的时候看过一本书叫<深入浅出数据分析>,非常通俗易懂,是我数据分析的启蒙书籍~分享下当时的笔记,书里的案例经常会在我之后的工作中给我灵感.同系列有一本<深入浅出统计学>,也写的很棒,公式较多所以是做的纸质版的笔记,以后也会分享. Chapter 1 数据分析引言 分解数据 需求:如何提升销量 主要内容:数据分析的流程,统计模型与心智模型. 1.数据分析的流程: 确定:了解问题.客户将帮助你确定问题. 分解:分解问题和数据,让他成为更小的组成部分.找出高效的比较因子

python数据分析入门笔记[1]

1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 (3)用于读写硬盘上基于数组的数据集的工具 (4)线性代数运算.傅里叶变换,以及随机数生成 (5)用于将C.C++.Fortran代码集成到python的工具 2.pandas pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数.pandas兼具Numpy高性能的数组计算功能以及

利用python进行数据分析--(阅读笔记一)

以此记录阅读和学习<利用Python进行数据分析>这本书中的觉得重要的点! 第一章:准备工作 1.一组新闻文章可以被处理为一张词频表,这张词频表可以用于情感分析. 2.大多数软件是由两部分代码组成:少量需要占用大部分执行时间的代码,以及大量不经常执行的“粘合剂代码”. cython已经成为python领域中创建编译型扩展以及对接c/c++代码的一大途径. 3.在那些要求延迟性非常小的应用程序中(例如高频交易系统),为了尽最大可能地优化性能,耗费时间使用诸如C++这样更低级.更低生产率的语言进行

[学习笔记] [数据分析] 01.Python入门

1.安装Python与环境配置 ① ② 安装pip以及利用pip安装Python库 2.Anaconda安装 conda list 要在root环境下 3.常用数据分析库 ① Numpy 安装:conda install numpy (conda在Anaconda上安装,pip则是在本地上安装) 提供常用的数值.数组.矩阵函数. 基于"向量化"的运算,进行数值运算时比list高. ② Scipy 安装:conda install scipy 是一种使用NumPy来做高等数学.信号处理.

《利用python进行数据分析》读书笔记--第九章 数据聚合与分组运算

对数据进行分组并对各组应用一个函数,是数据分析的重要环节.数据准备好之后,通常的任务就是计算分组统计或生成透视表.groupby函数能高效处理数据,对数据进行切片.切块.摘要等操作.可以看出这跟SQL关系密切,但是可用的函数有很多.在本章中,可以学到: 根据一个或多个键(可以是函数.数组或DataFrame列名)拆分pandas对象 计算分组摘要统计,如计数.平均值.标准差.,或自定义函数 对DataFrame的列应用各种各样的函数 应用组内转换或其他运算,如规格化.线性回归.排名或选取子集等