1.将数据(csv格式)导入jupyter
import pandas as pd
import matplotlib.pyplot as plt
filename=‘data.csv‘
raw=pd.read_csv filename
print(raw.shape)
raw.head()#打印前几行
2.去掉某一列的空值
kobe=raw[pd.notnull(raw[‘shot_made_flag‘])]
print(kobe.shape)
3.用matplotlib画图
alpha=0.02#点的透明程度,越小透明度越高
plt.figure(figsize=(10,10))
plt.subplot(121)#一行两列,第一个
plt.scatter(kobe.loc_x,kobe.loc_y,color=‘blue‘,alpha=alpha)#散点图
plt.title(‘loc_x and loc_y‘)
plt.subplot(122)#一行两列,第一个
plt.scatter(kobe.loc_x,kobe.loc_y,color=‘green‘,alpha=alpha)#散点图
plt.title(‘lat and lon‘)
4.打印唯一值
print(kobe.action_type.unique())
print(kobe.combined_shot_type.unique())
print(kobe.shot_type.unique())
print(kobe.shot_type.value_counts())#相同值出现次数
5.
时间: 2024-10-11 13:31:27