绘制这折现图
导入响应的包
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
%matplotlib inline
from matplotlib import pylab
import matplotlib.pyplot as plt
随机生成数据
df = DataFrame(np.random.randint(0,150,size =(10,3)),columns=["python","math","java"])
折线图:
折线图和带数据标记的折线图 折线图用于显示随时间或有序类别而变化的趋势,可能显示数据点以表示单个数据值,也可能不显示这些数据点。
df.plot()
柱状图
df.plot()
df.plot(kind="hist")
直方图
①能够显示各组频数分布的情况;②易于显示各组之间频数的差别。
df1 = Series(np.random.randint(0,10,size = 10))
df1.plot(kind = "hist")
df1
df1 = DataFrame(np.random.randn(100000,1),columns=["A"] ) 随机生成正太分布的数据
df1.plot(kind = "hist",bins= 100) #bins 表示数据分成多少组,图形表示在每个组中数据出现的个数
绘制密度曲线
密度曲线:又称总体密度分布曲线。这条曲线排除了由于取样不同和测量不准所带来的误差,能够精确地反映总体的分布规律。
df1.plot(kind = "density") #density表示密度曲线
将直方图和密度曲线图合成一个图
如下操作:
ax = plt.subplot(1,1,1) #ax为matplotlib轴对象,设置一行一列一个即显示一张图
df1.plot(kind = "hist",bins = 100,ax = ax,density= True)
#设置直方图的分组为100个,添加轴对象,将纵坐标设置成为密度曲线的纵坐标,直方图的纵坐标值为左过归一化处理的值
df1.plot(kind = "density",ax = ax) #添加轴对象,图形类型为密度曲线图
盒子图:
称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。
df.plot(kind = "box")
散点图
作用:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。
df3 = DataFrame(np.random.randint(0,150,size =(100,2)),columns=["python","math"])
df3.plot(y = "python",x = "math",kind = "scatter") python列数据做为纵坐标,math列数据作为横坐标,图形类型为scatter散点图
添加数据,画出python和math的是否相关的三点图
经过观察,未能发现math和python的关系
假设python和math之间存在正相关,关系映射,然后再画出散点图进行观察
df3["python"] = df3["math"].map(lambda x:x+np.random.randint(-10,10,size =1)[0]) #添加映射关系
df3.plot(y = "python",x = "math",kind = "scatter") #画出三点图
可以发现python 和math存在正相关关系
原文地址:https://www.cnblogs.com/kuangkuangduangduang/p/10284806.html