【数据分析&数据挖掘】连锁超市数据分析案例

 1 import pandas as pd
 2
 3 # 加载数据
 4 data = pd.read_csv("./order.csv", encoding="ansi")
 5 # print("data: \n", data)
 6 print("data的列索引: \n", data.columns)
 7
 8 # 销量中存在销量为0， 或者销量<0的数据
 9 # 删除不正确的数据
10 # ——保留销量>0的数据据
11 bool_index = data.loc[:, "销量"] > 0
12 data = data.loc[bool_index, :]
13
14 # 1、哪些类别的商品比较畅销？
15 # 按照类别id进行分组， 统计销量的sum
16 # sort_values 排序，默认是升序排序
17 # by 指定按照某列的数据进行排序
18 # ascending = True 升序
19 res = data.groupby(by="类别ID")["销量"].sum().sort_values(ascending=False).head(10)
20 res = pd.pivot_table(
21     data=data,
22     index="类别ID",
23     # columns="类别ID",
24     values="销量",
25     aggfunc="sum"
26 ).sort_values(by="销量", ascending=False).head(10)
27 print("res: \n", res)
28
29 # 2、哪些商品比较畅销
30 res = data.groupby(by="商品ID")["销量"].sum().sort_values(ascending=False).head(10)
31 res = pd.pivot_table(
32     data=data,
33     index="商品ID",
34     values="销量",
35     aggfunc="sum"
36 ).sort_values(by="销量", ascending=False).head(10)
37 print("res: \n", res)
38
39 # 3、求不同门店的销售额占比
40 # (1)先计算每一个商品的销售额
41 data.loc[:, "销售额/单个商品"] = data.loc[:, "单价"] * data.loc[:, "销量"]
42
43 # (2)按照门店编号进行分组，统计每个商品的销售额的sum和
44 all_ = data.groupby(by="门店编号")["销售额/单个商品"].sum()
45
46 print(all_)
47 # (3)计算占比
48 print("各个门店的占比为：", (all_ / all_.sum()).apply(lambda x: format(x, ".2%")))
49
50
51 # 4、哪个时间段是超市的客流高峰期？
52 # (1)因为多个商品对应一个订单ID，每一个订单ID为一个人，需先对ID进行去重
53 # 数据的去重
54 # subset 需要去重的列
55 # inplace = True 修改原数据
56 data.drop_duplicates(subset=‘订单ID‘, inplace=True)
57 print("去重之后的数据: \n", data)
58
59 # (2)获取小时属性
60 data.loc[:, "成交时间"] = pd.to_datetime(data.loc[:, "成交时间"])
61
62 data.loc[:, "hour"] = [i.hour for i in data.loc[:, "成交时间"]]
63
64 print(data)
65
66 # (3)按照小时分组，统计每个小时内订单的数量
67 res = data.groupby(by="hour")["订单ID"].count().sort_values(ascending=False)
68
69 print("res: \n", res)
70
71 # sort_index() 按照行索引的大小进行排序

原文地址：https://www.cnblogs.com/Tree0108/p/12116085.html

时间： 2024-12-09 13:48:00

【数据分析&数据挖掘】连锁超市数据分析案例的相关文章

【转】数据分析/数据挖掘入门级选手建议

1.数据分析和数据挖掘联系和区别联系:都是搞数据的区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力.数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =. 2.怎么入门请百度"如何成为一名数据分析师"或者"如何成为一名数据挖掘工程师".英文好上Quora,不行上知乎,看看入门资料. 3.选哪些书看入门资料给你提供的书,有电子版下电子版,没电子版买纸质书,花不了多少钱. 4.用什么语言数据分析:excel是必须,R是基本,pytho

PL1936-大数据快速数据挖掘平台RapidMiner数据分析

随笔背景:在很多时候,很多入门不久的朋友都会问我:我是从其他语言转到程序开发的,有没有一些基础性的资料给我们学习学习呢,你的框架感觉一下太大了,希望有个循序渐进的教程或者视频来学习就好了.对于学习有困难不知道如何提升自己可以加扣:1225462853进行交流得到帮助,获取学习资料. 下载地址:http://pan.baidu.com/s/1jI05TPW 炼数成金大数据课程大数据快速数据挖掘平台RapidMiner数据分析数据挖掘视频教程课程简介: 作为一门学科,数据挖掘对于世人来说在很

06-机器学习.数据分析.数据挖掘的区别于联系

数据分析:数据分析是指用适当的统计分析方法对手机的大量数据进行分析,并提取有用的信息,以及形成结论,从而对数据进行详细的研究和概括过程.在实际工作中,数据分析可帮助人们做出判断;数据分析一般而言可以分为统计分析.探索性数据分析和验证性数据分析三大类. 数据挖掘:一般指从大量的数据中通过算法搜索隐藏于其中的信息的过程.通常通过统计,检索.机器学习.模式匹配等诸多方法来实现这个过程. 机器学习:是数据分析和数据挖掘的一种比较常用.比较好的手段.. 原文地址:https://www.cnblogs.c

隆力奇E家连锁超市怎样赚钱？

隆力奇E家连锁超市怎样赚钱? 首先,在E家连锁,您只要加盟,公司就会送您100个"分店",让您终生享受"分店"带来的利益,再也不用为日渐利薄而愁苦. E家连锁收益,拓展分店: 其次,在E家连锁,只要您拓展了您的分店,不论是您个人直接推荐的.还是系统帮助您推荐的,您都可以享受四项利润分成,每周收入最高可达36万元. E家连锁收益,自然销售: 第三,在E家连锁,线上线下都能够轻松自如的销售,不用局限于传统的销售模式,更不用局限于传统的品牌薄弱的怪圈之中,隆力奇电商平

【转】数据运营经验：什么是数据分析？怎么做数据分析？

那到底什么是数据分析呢? 说说数据哥的理解:数据分析是基于商业目的,有目的的进行收集.整理.加工和分析数据,提炼有价信息的一个过程. 其过程概括起来主要包括:明确分析目的与框架.数据收集.数据处理.数据分析.数据展现和撰写报告等6个阶段. 1.明确分析目的与框架一个分析项目,你的数据对象是谁?商业目的是什么?要解决什么业务问题?数据分析师对这些都要了然于心. 基于商业的理解,整理分析框架和分析思路.例如,减少新客户的流失.优化活动效果.提高客户响应率等等.不同的项目对数据的要求,使用的分析手段

某大型连锁超市库存管理系统分析报告

全部内容可直接下载(含各层DFD图):https://yunpan.cn/cBqgN2DaBAKig 访问密码 a2e3 目录一.前言 2 二.现行库存管理系统概况 3 2.1企业发展概况 3 2.2目前企业库存流程调查情况 3 2.3目前信息载体调查情况 7 三.库存管理系统需求分析 9 3.1现行系统的不足分析 9 3.2信息需求分析 9 3.3功能需求分析 9 四.数据模型及编码模型设计 12 4.1数据字典 12 4.

连锁超市选择会员软件系统有什么好处？

随着社会经济的不断发展,人们生活水平也随之提高,目前,越来越多的人开始从事批发零售业,有些商家是有多个营业点的连锁结构企业,而有些商家只有单个店铺,尽管每个商家经营的大小不一样,可都避免不了在经营过程中要应用收银系统.那么,对于连锁超市而言,选择会员软件系统有哪些好处呢? 1.进销存以及财务管理从事超市行业的企业避免不了要对进货.销售.库存.财务整条线进行管理,而收银系统能将进销存和财务数据全部统计起来,商家可随时查看并分析企业进销存以及财务情况,企业运营情况一切尽在掌中. 2.帮助企业扩大业

大型连锁超市库存管理系统便利店收银系统软件

商拓软件大型连锁超市库存管理系统,便利店收银系统软件的使用方式: 1.客户将商品对准商品扫描器,录入产品价格 2.多个同类商品,可以直接扫描获取也可以点击屏幕加号添加 3.点击"确认付款" 4.选择付款方式:支付宝.微信等扫描支付商拓大型连锁超市库存管理系统特征: 一.流程简单化从界面到POS.收发货.增值业务.日常费用等,均按业务操作习惯进行设计,所有操作集中同一界面,点击或触摸使用,便捷直观. 一体化门店,门店无后台软件,操作流程简单化,无须培训便可上岗! 二.零维护采用大集

Python数据分析与展示(1)-数据分析之表示(1)-NumPy数据存取与函数

NumPy数据存取与函数数据的CSV文件存取 CSV文件 CSV(Comma-Separated Value,逗号分隔值) CSV是一种常见的文件格式,用来存储批量数据. 将数据写入CSV文件 np.savetxt(frame, array, fmt='%.18e', delimiter=None) -frame: 文件.字符串或产生器,可以是.gz或.bz2的压缩文件 -array: 存入文件的数组 -fmt: 写入文件的格式,例如:%d %.2f %.18e -delimiter:分割字符