用Excel做数据分析常用函数(数据清理、关联匹配……)

本文总结在使用Excel进行数据分析时,最常用的功能和函数。

Excel的功能和函数非常多,用进废退,除了学习基本的函数和功能,最重要的是遇到问题可以快速的搜索并解决。

首先Excel可以处理的数据量有大多?

使用Ctrl +  → , Ctrl + ↓可以看到下界为104,8576,右界为24(X)*6(F)*4(D)=576    (Excel 2010版本)

一、数据清理

1)Trim()--空格清理

清除掉字符串两边的空格

2)CONCATENATE()--连接

CONCATENATE函数与“&”连接符都可以用来连接多个文本字符串,当要连接的内容较多时,用函数比较方便。

3)Replace()--替换

replace(需要进行替换的字符串,替换起点,替换字符个数,替换成什么内容)

替换起点是从1开始计数的,空格也算位数

4)substitute()--替换

substitute(需要替换的文本,旧文本,新文本,[instance_num])

instance_num用来指定以 new_text新文本替换第几次出现的旧文本,不设定则默认替换所有出现过的旧文本

substitute函数经常用来去掉文本之间的空格

5)Left/Right/Mid--截取

Left/Right(指定字符串,截取位数)

Mid(指定字符串,开始位置,截取长度)

6)Len/Lenb--长度计算

返回字符串的长度,在len中,中文计算为一个,在lenb中,中文计算为两个。

7)Findsearch--查找

Find(要查找的字符串,被查找的字符串,从第几个字符开始查找(默认1,从头查找))

返回某字符串出现的位置,与Left/Right/Mid结合能完成简单的文本提取

search和Find类似,区别是Search大小写不敏感,且支持通配符

二、关联匹配

1)VLookupLookup

VLookup(①找什么,②在哪个区域找,③返回第几列,④匹配类型)

②区域要包含①③列,且①在第一列

④0为精确匹配,1为模糊匹配:找小于等于自己的最大值,多用于找区间

2)Index+Match

可以比Vlookup更灵活的完成查找匹配的任务

Match(找什么,查找区域,匹配类型)       匹配类型:大于、小于或等于

Index(查找区域,②返回第几行数据,返回第几列数据)

Index和match结合使用,Index②使用Match返回的行数

3)row/column/offset

row()返回单元格所在的行数,column()返回单元格所在的列数

OFFSET(起始点,向下移动行数,向右移动列数,取值行数,取值列数)

返回距离起始点的值或者区域。正数代表向下或向左,负数则相反。

offset(X,Y,Z,1,1)返回单值

ctrl+shift+enter返回数组

原文地址:https://www.cnblogs.com/tongtong123/p/10712846.html

时间: 2024-11-07 21:10:06

用Excel做数据分析常用函数(数据清理、关联匹配……)的相关文章

项目开发流程,以及什么是数据分析平台,再者为什么要做数据分析平台,数据来源,数据处理流程

一:项目开发流程 1.项目调研 了解项目的初始需求,然后结合市场的技术,看一下能否完成 2.需求分析 明确一个项目到底需要做什么? 最终做出的是什么样子? 重要性:一个好的需求分析能够明确项目的后续发展主题方向 3.方案设计 概要设计: 项目结构,技术选型 详细设计: 按照模块设计 4.编码实现 具体实现 5.测试 功能测试:功能是否达到了需求 集成测试:模块之间的兼容性 压力测试:高并发,多用户下,系统是否可以运行 用户测试:根据用户的建议进行修改 6.上线 试运行阶段:新系统与老系统同时在线

orale做报表常用函数和表达式的总结

最近一段时间连续的做了几十张报表,通过原生sql对数据进行分析 ,也算是有了一定的了解,发现其中一些函数和表达式使用频率较高,现总结如下: (1).round()函数   round函数说白了就是把一个数按照指定的小数位元数进行四舍五入运算的结果 语法形式:ROUND( number, decimal_places ) number: 需要处理的数值   decimal_places : 四舍五入 , 小数取几位 ( 预设为 0 ) 例子: select round(123.456, 0) fr

python中数据分析常用函数整理

一. apply函数 作用:对 DataFrame 的某行/列应用函数之后,Apply 返回一些值.函数既可以使用默认的,也可以自定义.注意:在第二个输出中应用 head() 函数,因为它包含了很多行. #创建一个新函数 def num_missing(x): return sum(x.isnull()) #应用每一列 print "Missing values per column:" print data.apply(num_missing, axis=0) #axis=0 def

数据分析常用的Excel函数

Excel是我们工作中经常使用的一种工具,对于数据分析来说,这也是处理数据最基础的工具. 本文对数据分析需要用到的函数做了分类,并且有详细的例子说明,文章已做了书签处理,点击可跳转至相应位置. 函数分类: 关联匹配类 清洗处理类 逻辑运算类 计算统计类 时间序列类 一.关联匹配类 经常性的,需要的数据不在同一个excel表或同一个excel表不同sheet中,数据太多,copy麻烦也不准确,如何整合呢?这类函数就是用于多表关联或者行列比对时的场景,而且表越复杂,用得越多. 包含函数:VLOOKU

为什么需要数据可视化,如何用图表讲故事?【做数据分析的必看】

我们为什么数要数据可视化,如何用图表讲故事?# 大家经常需要做数据可视化,然后用PPT来说服高层或者做各类决策,今天分享一些做PPT的技巧! 温馨提示:用派代APP看的派友,请在有WIFI的网络下观看,图多会打开比较慢哦~ 先看个数据可视化视频: -------------------------------------------华丽丽的分割线--------------------------------------------- 一.  图表在沟通中扮演重要的角色 1. 主要角色(图下)

Excel常用函数总结

Excel常用函数总结 2016-10-28 Kevin 叼着奶瓶撩妹 1. VLOOKUP函数 常见形式 问题描述:将下图中G列的数据根据学生的姓名填充到D列. 公式解析: =VLOOKUP(A2,$F$2:$G$16,2,FALSE) 参数1:需要查询的数据 参数2:指定查询的区域,必须包含查找值和返回值,且第1列必须是查找值 参数3:$F$2:$G$16区域的第2例 参数4:指定的查找方式,TRUE表示模糊 查找,FALSE表示精确查找 解法之二 上图中的问题也可使用INDEX+MATCH

Excel常用函数公式TOP6(下)

正如我们所知,Excel在数据分析中是一个必不可少的工具,不管是分析师.业务还是运营人员,最常用到的工具软件非Excel莫属,接下来介绍一下在Excel中较为常用的一些函数公式. 1.vlookup---条件查找函数用法:=vlookup(要查找的目标,查找范围,返回第几列的内容,精确或者近似结果)PS:查找值必须在返回值的前面. 2.lookup---多条件查找函数用法:=lookup(1,0/((条件区域1=条件1)*(条件区域2=条件2)),查找目标的区域) 3.mid---提取字符串函数

大数据技术之_18_大数据离线平台_01_项目开发流程+大数据常用应用/分析平台/业务处理方式+数据分析平台的数据来源+数据处理的流程+项目集群的规模+需求分析+技术架构/选型

一.项目开发流程1.1.项目调研1.2.项目需求分析1.3.方案设计1.3.1.概要设计1.3.2.详细设计1.4.编码实现1.4.1.单元测试1.4.2.集成测试1.4.3.压力测试1.4.4.用户测试二.大数据常用应用2.1.数据出售2.2.数据分析2.2.1.百度统计2.2.2.友盟2.2.3.其他统计分析组织2.3.搜索引擎2.3.1.solr2.3.2.luence2.3.3.luence & solr 对比2.4.推荐系统(高数)2.4.1.技术2.4.2.算法2.5.精准营销2.5

dplyr 数据操作 常用函数(4)

接下来我们继续了解一些dplyr中的常用函数. 1.ranking 以下各个函数可以实现对数据进行不同的排序 row_number(x) ntile(x, n) min_rank(x) dense_rank(x) percent_rank(x) cume_dist(x) 具体的看些例子. x <- c(5, 1, 3, 2, 2, NA) x row_number(x) row_number是对数据大小进行编号排序,遇到重复值,排序继续加1,缺失值不计入 min_rank(x) min_rank