数据可视化分析(柱状图、折线图、热力图)

一、项目简介

1.1    项目博客地址

https://rpc.cnblogs.com/metaweblog/yyh28

1.2    项目完成的功能与特色

分析文件‘集美大学各省录取分数.xlsx’,完成以下功能:
1)集美大学2015-2018年间不同省份在本一批的平均分数,柱状图展示排名前10的省份,
2)分析福建省这3年各批次成绩情况,使用折线图展示结果,并预测2019年录取成绩
3)分析其他省份数据。用热力图,地图方式绘制所有省份数据情况。

1.3 项目采用的技术栈

Numpy:矩阵计算与其它大多数框架的数据处理基础;

Matplotlab:专业画图工具,话说这个单词还是真是在Matlab之间插入了plot这个词形成的;

Pandas:提供类似于R语言的DataFrame操作,非常方便;

百度地图API

热力图

1.3    项目借鉴源代码的地址

https://www.jianshu.com/p/c18dedc38b7b

1.4    团队成员任务分配表

二、项目的需求分析

对文件数据进行提取、分析

三、项目功能架构图、主要功能流程图

四、系统模块说明

4.1 系统模块列表

柱状图、折线图、热力图

4.2 各模块详细描述(名称,功能,运行截图,关键源代码)

4.2.1柱状图:集美大学2015-2018年间不同省份在本一批的平均分数,展示排名前10的省份。

#绘图
plt.figure()
plt.bar(x=province_dict_keys,height=province_dict_values,alpha=0.8)
for x,y in enumerate(province_dict_values):
    plt.text(x, y, ‘%s‘ % y, ha=‘center‘, va=‘bottom‘)
#设置标题
plt.title("排名前10的省份")
# 为两条坐标轴设置名称
plt.xlabel("省份")
plt.ylabel("平均分")
#图片的显示及存储
log = datetime.datetime.now().strftime(‘%Y-%m-%d‘)
# plt.savefig(‘./logging/%s_all_a.jpg‘ % log)   #图片的存储
# plt.close()   #关闭matplotlib
4.2.2折线图:分析福建省这3年各批次成绩情况,使用折线图展示结果,并预测2019年录取成绩

#折线图

plt.figure()

plt.plot(grade_year,grade,‘ro-‘, color=‘#4169E1‘, alpha=0.8, label=‘提前批航海类(理工)‘)

plt.plot(grade_year,grade1,‘ro-‘, color=‘#FFFA12‘, alpha=0.8, label=‘师范类(面向全省)(理工)‘)

plt.plot(grade_year,grade2,‘ro-‘, color=‘#78FF1D‘, alpha=0.8, label=‘师范类(面向厦门)(理工)‘)

plt.plot(grade_year,grade3,‘ro-‘, color=‘#1CFFB7‘, alpha=0.8, label=‘农村专项计划(理工)‘)

plt.plot(grade_year,grade4,‘ro-‘, color=‘#1BE9FF‘, alpha=0.8, label=‘本一批(理工)‘)

plt.plot(grade_year,grade5,‘ro-‘, color=‘#1F98FF‘, alpha=0.8, label=‘本一批(面向厦门)(理工)‘)

plt.plot(grade_year,grade6,‘ro-‘, color=‘#2237FF‘, alpha=0.8, label=‘闽台合作(理工)‘)

plt.plot(grade_year,grade7,‘ro-‘, color=‘#BA6BFF‘, alpha=0.8, label=‘预科批(理工)‘) #在当前绘图对象绘图(X轴,Y轴,蓝色虚线,线宽度)

for y in [grade,grade1,grade2,grade3,grade4,grade5,grade6,grade7]:

    for x,yy in zip(grade_year,y):

        plt.text(x, yy+1,str(yy), ha=‘center‘, va=‘bottom‘, fontsize=7)

plt.xlabel("年份") #X轴标签

plt.ylabel("分数线") #Y轴标签

plt.title("福建省这3年理工各批次成绩情况") #标题

# plt.savefig(‘./logging/%s_all_b.jpg‘ % log)   #图片的存储

#显示图示

plt.legend()

plt.show()
4.2.3热力图:分析其他省份数据。有精力同学可以研究热力图,地图方式绘制所有省份数据情况。

gr=batch(‘本一批‘,‘理工‘)

gr=sorted(gr.items(),key=lambda x:x[1],reverse=True)

file = open(r‘../point.json‘,‘w‘) #建立json数据文件

point_pr(gr,file)

#获取经纬度

def getlnglat(address):

    url = ‘http://api.map.baidu.com/geocoding/v3/‘

    output = ‘json‘

    ak = ‘8atpMUyuexdbuYFU838ejPvSPnWYZoks‘

    add = quote(address) #由于本文城市变量为中文,为防止乱码,先用quote进行编码

    uri = url + ‘?‘ + ‘address=‘ + add  + ‘&output=‘ + output + ‘&ak=‘ + ak

    req = urlopen(uri)

    res = req.read().decode() #将其他编码的字符串解码成unicode

    temp = json.loads(res) #对json数据进行解析

    return temp

def point_pr(gr,file):

#每个省份的经纬度

    print(gr)

    for line in gr:

        # line是个list,取得所有需要的值

        b = line[0] #将第一列city读取出来并清除不需要字符

        if b == ‘西藏‘ or b == ‘‘:

            continue

        c= line[1]#将第二列price读取出来并清除不需要字符

        lng = getlnglat(b)[‘result‘][‘location‘][‘lng‘] #采用构造的函数来获取经度

        lat = getlnglat(b)[‘result‘][‘location‘][‘lat‘] #获取纬度

        str_temp = ‘{"lat":‘ + str(lat) + ‘,"lng":‘ + str(lng) + ‘,"count":‘ + str(c) +‘},‘

        # print(str_temp) #也可以通过打印出来,把数据copy到百度热力地图api的相应位置上

        file.write(str_temp) #写入文档

    file.close()

五、项目总结

5.1 特点

对集美大学近几年的录取分数进行分析,并生成图表

5.2 不足之处

整体不够美观

码云地址:https://gitee.com/leaf28/university.git

原文地址:https://www.cnblogs.com/yyh28/p/12006076.html

时间: 2024-11-05 13:49:43

数据可视化分析(柱状图、折线图、热力图)的相关文章

55个最实用大数据可视化分析工具

该文转自[IT168 技术] 近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取.归纳并简单的展现.传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息.新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集.筛选.分析.归纳.展现决策者所需要的信息,并根据新增的数据进行实时更新.因此,在大数据时代,数据可视化工具必须具有以下特性: (1)实时性:数据可视化工具必须适应大数据时代数

55个最实用的大数据可视化分析工具

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性:我们还需要跨学科的团队,而不是单个数据科学家.设计师或数据分析员:我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET.

奥威Power-BI服装行业BI数据可视化分析--动销商品分析

奥威Power-BI服装行业BI数据可视化分析--动销商品分析,需求概述:(1)该分析报表是一个简单的动销产品分析,展示动销SKU的实时数据,包括价格.销量.各门店库存以及本周销售趋势(2)表格内容包括款式.款名.型号.价格.销量,并且显示该型号的图片以便定位准确:(3)柱形图为各个门店的库存数量,通过点击表格的产品型号,可以联动到柱图,看该型号在各门店的库存情况:(4)折线图为本周销售趋势,通过点击表格的产品型号,可以联动到折线图,看该型号本周的销售趋势: 原文出处:http://www.po

C# 绘制统计图(柱状图, 折线图, 扇形图)

统计图形种类繁多, 有柱状图, 折线图, 扇形图等等, 而统计图形的绘制方法也有很多, 有Flash制作的统计图形, 有水晶报表生成统计图形, 有专门制图软件制作, 也有编程语言自己制作的:这里我们用就C# 制作三款最经典的统计图: 柱状图, 折线图和扇形图:既然是统计, 当然需要数据, 这里演示的数据存于Sql Server2000中, 三款统计图形都是动态生成. 其中柱状图我会附上制作步骤, 其他两款统计图直接附源码. 说明: 需求不一样, 统计图形绘制后的显示效果也不一样, 比如这里柱状图

盘点最实用的大数据可视化分析工具(1/4)

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性:我们还需要跨学科的团队,而不是单个数据科学家.设计师或数据分析员:我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET.

C# 绘制统计图(柱状图, 折线图, 扇形图)【转载】

统计图形种类繁多, 有柱状图, 折线图, 扇形图等等, 而统计图形的绘制方法也有很多, 有Flash制作的统计图形, 有水晶报表生成统计图形, 有专门制图软件制作, 也有编程语言自己制作的:这里我们用就C# 制作三款最经典的统计图: 柱状图, 折线图和扇形图:既然是统计, 当然需要数据, 这里演示的数据存于Sql Server2000中, 三款统计图形都是动态生成. 其中柱状图我会附上制作步骤, 其他两款统计图直接附源码. 说明: 需求不一样, 统计图形绘制后的显示效果也不一样, 比如这里柱状图

JfreeChart在EXCEL中生成饼状图/柱状图/折线图

Maven <dependency> <groupId>jfree</groupId> <artifactId>jfreechart</artifactId> <version>1.0.13</version> </dependency> Java import org.apache.poi.ss.usermodel.Drawing; import org.apache.poi.ss.usermodel.She

大数据可视化分析平台新应用:提升企业的数字营销策略

数字化时代,催生了不少社交媒体和搜索引擎公司.无论是国内还是国外乃至全球,社交媒体的势力愈加强大,与此也产生了大量的数据,成为大数据中的一部分.企业发展到一定地步,免不了大大小小的决策,这驱使着越来越多的企业选择商业智能产品——大数据可视化分析平台来合理利用它们积累的数据基础. 如今,从Facebook到Instagram,许多社交媒体渠道现在正在淹没在大量数据中.每天,超过400万小时的视频内容上传到YouTube,而每天有43亿条消息在Facebook网上发布. 随着可用于分析的数据量继续呈

如何用FineReport报表进行数据可视化分析?

独立的数据毫无意义,能进行比较和分析的数据才是有价值的数据.在FineReport报表工具中,数据的录入和展示操作只是开始,之后的数据分析才是重头戏.那么在FineReport中经过怎样的配置才能进行数据分析?又怎么进行数据分析呢? 使用FineReport进行数据可视化分析非常简单,经过简单的配置,使用者只需在B/S端简单拖拽目标数据及相关维度,即可得到从不同维度分析的结果,提升数据可视化程度,帮助决策层做出准确的决策.同时降低了系统开发的定制化程度,极大地降低了系统开发者的维护成本. B/S

一周实现大数据可视化分析——敏捷BI助艾瑞咨询集团实现互联网的大数据分析

相对传统分析方法,通过敏捷BI和Hadoop的互补,艾瑞咨询集团的业务效率获得数倍的提升:线下报告交付周期从3至4周缩短至小于1周,软件交付从半年缩短至一个月. 当前,一提到大数据人们就会想Hadoop,它似乎成为大数据的"代言人".不可否认,Hadoop在集群扩展性和成本上都有巨大的优势,但是,Hadoop并不适合做实时分析系统. 因此,很多企业都会利用Hadoop实现数据存储,再通过其他工具实现对大数据的高速捕获和实时分析.这里,我们将通过艾瑞咨询集团的一个真实案例,解读一下敏捷B