Python数据分析-Kobe Bryan生涯数据读取及分析

1.将数据(csv格式)导入jupyter

import pandas as pd

import matplotlib.pyplot as plt

filename=‘data.csv‘

raw=pd.read_csv filename

print(raw.shape)

raw.head()#打印前几行

2.去掉某一列的空值

kobe=raw[pd.notnull(raw[‘shot_made_flag‘])]

print(kobe.shape)

3.用matplotlib画图

alpha=0.02#点的透明程度,越小透明度越高

plt.figure(figsize=(10,10))

plt.subplot(121)#一行两列,第一个

plt.scatter(kobe.loc_x,kobe.loc_y,color=‘blue‘,alpha=alpha)#散点图

plt.title(‘loc_x and loc_y‘)

plt.subplot(122)#一行两列,第一个

plt.scatter(kobe.loc_x,kobe.loc_y,color=‘green‘,alpha=alpha)#散点图

plt.title(‘lat and lon‘)

4.打印唯一值

print(kobe.action_type.unique())

print(kobe.combined_shot_type.unique())

print(kobe.shot_type.unique())

print(kobe.shot_type.value_counts())#相同值出现次数

5.

时间: 2024-10-11 13:31:27

Python数据分析-Kobe Bryan生涯数据读取及分析的相关文章

Python数据分析、数据采集、数据可视化、图像数据处理分析视频教程

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

使用python+selenium对12306车票数据读取

一.摘要 突发奇想想读取12306的车票信息,最开始想用requests,但是突然又想试试selenium的无界面浏览器.有部分正则没调好,写好就懒得调了. 套用我师傅的话就是:我凭本事写的bug,凭什么要改! 二.方案思路 url = https://kyfw.12306.cn/otn/leftTicket/init 1.模拟用户是怎么查车票信息.然后通过selenium去操作浏览器. 2.最后输出字典. 三.源码 #-*- coding:utf-8 -*- #__anthor__:"Klay

【Python数据分析】第二篇--数据计算

分组计算: Group By : split – apply – combine split: 很具某些条件对数据进行分组 apply:对每一个group独立的应用函数 combine:将结果数据组合到某种数据结构中 pokemon = pd.read_csv('Pokemon.csv') #读文件 pokemon['Type 1'].value_counts() # 分组 groupby grouped1 = pokemon.groupby('Type 1') 计算: 1.求平均 .mean(

【Python数据分析】pandas时刻数据:Timestamp

目录 1.Timestamp 2.to_datetime 2.1 单个时间转化 2.2 多个时间转化 所谓的时刻数据代表时间点,是pandas的数据类型,是将值与时间点相关联的最基本类型的时间序列数据. 1.Timestamp Timestamp是将数据类型转化为pandas的Timestamp类型 import pandas as pd import datetime date1 = datetime.datetime(2019, 12, 31, 12, 1, 2) # 创建一个datetim

高端实战 Python数据分析与机器学习实战 Numpy/Pandas/Matplotlib等常用库

课程简介:? ? 课程风格通俗易懂,真实案例实战.精心挑选真实的数据集为案例,通过Python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例.课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例.算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习.旨在帮助同学们快速上手如何使用python库来完整机器学习案例. ------------------

基于Python数据分析与机器学习案例实战教程

课程--基于Python数据分析与机器学习案例实战教程 分享网盘下载--https://pan.baidu.com/s/1jHSaRAY 密码: xk37 课程背景基于数据分析与机器学习领域,使用python作为课程的实战语言,随着大数据与人工智能领域日益火爆,数据分析和机器学习建模成了当下最热门的技术,课程旨在帮助同学们快速掌握python数据分析包以及经典机器学习算法并通过对真实数据集分析进行实战演示. 课程风格通俗易懂,基于真实数据集案例实战. 主体课程分成三个大模块 (1)python数

Python数据分析案例(实战)视频教程

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

Python数据分析与展示(1)-数据分析之表示(1)-NumPy数据存取与函数

NumPy数据存取与函数 数据的CSV文件存取 CSV文件 CSV(Comma-Separated Value,逗号分隔值) CSV是一种常见的文件格式,用来存储批量数据. 将数据写入CSV文件 np.savetxt(frame, array, fmt='%.18e', delimiter=None) -frame: 文件.字符串或产生器,可以是.gz或.bz2的压缩文件 -array: 存入文件的数组 -fmt: 写入文件的格式,例如:%d %.2f %.18e -delimiter:分割字符

小白学 Python 数据分析(11):Pandas (十)数据分组

人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 小白学 Python 数据分析(3):Pandas (二)数据结构 Series 小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame 小白学 Python 数据分析(5):Pandas (四)基础操作(1)查看数据 小白学 Python 数据分析(6):Pandas (五)基础操作(2)数据选择 小白学