【数据分析&数据挖掘】pandas时间数据

 1 import pandas as pd
 2 """
 3 pandas默认支持的时间点类型——Timestamp
 4 pandas默认支持的时间序列类型——DatetimeIndex
 5 numpy默认支持的时间点数据类型——datetime64
 6 """
 7
 8 # 可以使用pd.to_datetime 将时间点转化为pandas默认支持的时间点类型
 9 res = pd.to_datetime("2019-11-11")
10 print("res: \n", res)
11 print("res的类型: \n", type(res))
12
13 # 可以使用pd.to_datetime 将时间序列转化为pandas支持的时间序列类型
14 res = pd.to_datetime(["2019-11-11", "2019-12-12", "2020-02-14", "2020-03-07"])
15 print("res: \n", res)
16 print("res的类型: \n", type(res))
17
18 # 可以使用pd.DatetimeIndex 将时间序列转化为pandas支持的时间序列类型, 不能转化时间点
19 res = pd.DatetimeIndex(["2019-11-11", "2019-12-12", "2020-02-14", "2020-03-07"])
20 print("res: \n", res)
21 print("res的类型: \n", type(res))
22
23 # 加载detail
24 detail = pd.read_excel("../day05/meal_order_detail.xlsx")
25 print("detail: \n", detail)
26 print("detail的列名称: \n", detail.columns)
27 print(detail.dtypes)
28
29 # 将 place_order_time 转化为pandas默认支持的时间序列类型
30 detail.loc[:, "place_order_time"] = pd.to_datetime(detail.loc[:, "place_order_time"])
31 print(detail.dtypes)
32 # 可以提取出时间序列中的属性
33
34 # 年属性
35 year = [i.year for i in detail.loc[:, "place_order_time"]]
36 print("year: \n", year)
37
38 # 月属性
39 month = [i.month for i in detail.loc[:, "place_order_time"]]
40 print("month: \n", month)
41
42 # 日属性
43 day = [i.day for i in detail.loc[:, "place_order_time"]]
44 print("day: \n", day)
45
46 # 周属性——一年的第N周
47 week = [i.week for i in detail.loc[:, "place_order_time"]]
48 print("week: \n", week)
49
50 week_of_year = [i.weekofyear for i in detail.loc[:, "place_order_time"]]
51 print("week_of_year: \n", week_of_year)
52
53 day_of_year = [i.dayofyear for i in detail.loc[:, "place_order_time"]]
54 print("day_of_year: \n", day_of_year)
55
56 # 获取一周中的第N天
57 day_of_week = [i.dayofweek for i in detail.loc[:, "place_order_time"]]
58 print("day_of_week: \n", day_of_week)
59
60 # 获取周几
61 weekday = [i.weekday for i in detail.loc[:, "place_order_time"]]
62 print("weekday: \n", weekday)
63
64 weekday_name = [i.weekday_name for i in detail.loc[:, "place_order_time"]]
65 print("weekday_name: \n", weekday_name)
66
67 # 获取第几季度
68 quarter = [i.quarter for i in detail.loc[:, "place_order_time"]]
69 print("quarter: \n", quarter)
70
71 # 时间数据的运算
72 res = pd.to_datetime("2019-11-11") + pd.Timedelta(days=2)
73 res = pd.to_datetime("2019-11-11") + pd.Timedelta(weeks=1)
74 res = pd.to_datetime("2019-11-11") + pd.Timedelta(weeks=-1)
75
76 # 时间差——返回days
77 res = pd.to_datetime("2019-11-11") - pd.to_datetime("2002-1-8")
78 print("res: \n", res)
79 res = res.days
80 print("res: \n", res)
81 res = res/365
82 print("年龄: \n", res)
83
84 # 还可以获取本机的最初始时间、最大时间
85 print("本机的最小时间: \n", pd.Timestamp.min)
86 print("本机的最大时间: \n", pd.Timestamp.max)
87
88 # 生成时间数据的API
89 # start——开始日期
90 # end——结束日期
91 # periods——如果end不传, 生成时间数据的数量
92 # freq——默认按天
93 res = pd.date_range(start="2019-11-11", periods=5)
94 res = pd.date_range(start="2019-11-11", end="2019-11-16")  # end和period不能同时传
95 # 生成频次为36天
96 res = pd.date_range(start="2019-11-11", end="2020-11-16", freq="36D")
97 print(res)

原文地址:https://www.cnblogs.com/Tree0108/p/12116054.html

时间: 2024-08-30 16:50:46

【数据分析&数据挖掘】pandas时间数据的相关文章

【Python数据分析】pandas时刻数据:Timestamp

目录 1.Timestamp 2.to_datetime 2.1 单个时间转化 2.2 多个时间转化 所谓的时刻数据代表时间点,是pandas的数据类型,是将值与时间点相关联的最基本类型的时间序列数据. 1.Timestamp Timestamp是将数据类型转化为pandas的Timestamp类型 import pandas as pd import datetime date1 = datetime.datetime(2019, 12, 31, 12, 1, 2) # 创建一个datetim

关于pandas时间数据的集成处理

工作中遇到的一个问题: 统计各地区新能源汽车的充电时长 数据来源是北理新源的单日全球的运行数据. 这里仅统计北上广重庆四个地区的 数据处理的代码就省略了 需要整理好的是4个dataframe(数据已保存为H5格式) 分别是对应上述4个城市的: import pandas as pd from pyecharts import Boxplot,Pie,Page theme_echart='infographic' location_list=['shanghai','chongqing','gua

Python数据分析库pandas ------ 初识 matpoltlib:matplotliab画图怎么显示中文;设置坐标标签;主题;画子图;pandas时间数据格式转化;图例;

打开画布,传入x,y的值,可以简单的画出曲线图 1 import matplotlib.pyplot as plt 2 3 c = [ 4 0.9012051747628913, 0.9012051747628913, 0.9012051747628913, 0.9012051747628913, 5 0.9012051747628913, 0.9012051747628913, 0.9012051747628913, 0.9012051747628913, 6 0.90120517476289

python数据分析工具——Pandas、StatsModels、Scikit-Learn

Pandas Pandas是 Python下最强大的数据分析和探索工具.它包含高级的数据结构和精巧的工具,使得在 Python中处理数据非常快速和简单. Pandas构建在 Numpy之上,它使得以 Numpy为中心的应用很容易使用.Pandas的功能非常强大,支持类似于SQL的数据增.删.查.改,并且带有丰富的数据处理函数;支持时间序列分析功能;支持灵活处理缺失数据等. Pandas的安装相对来说比较容易,安装好 Numpy之后,就可以直接安装了,通过pip install pandas或下载

【转】数据分析/数据挖掘 入门级选手建议

1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力.数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =. 2.怎么入门 请百度"如何成为一名数据分析师"或者"如何成为一名数据挖掘工程师".英文好上Quora,不行上知乎,看看入门资料. 3.选哪些书 看入门资料给你提供的书,有电子版下电子版,没电子版买纸质书,花不了多少钱. 4.用什么语言 数据分析:excel是必须,R是基本,pytho

【数据挖掘导论】——数据质量

数据质量 数据挖掘使用的数据通常是为其他用途收集或者收集的时候还没有明确目的.因此数据常常不能在数据的源头控制质量.为了避免数据质量的问题,所以数据挖掘着眼于两个方面:数据质量问题的检测和纠正(数据清理):使用可以容忍低质量数据的算法. 测量和数据收集问题 完美的数据在实际中几乎是不存在的,对于存在的数据质量问题,我们先定义测量误差和数据收集错误,然后考虑测量误差的各种问题:噪声,伪像,偏倚,精度和准确度.接着讨论测量和数据收集的数据质量问题:离群点,遗漏和不一致的值,重复数据. 测量误差(me

Python数据分析之pandas学习

Python中的pandas模块进行数据分析. 接下来pandas介绍中将学习到如下8块内容:1.数据结构简介:DataFrame和Series2.数据索引index3.利用pandas查询数据4.利用pandas的DataFrames进行统计分析5.利用pandas实现SQL操作6.利用pandas进行缺失值的处理7.利用pandas实现Excel的数据透视表功能8.多层索引的使用 一.数据结构介绍 在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame.Ser

数据挖掘在大数据中的应用综述

*** (上海海事大学 上海 201306) 摘 要: 面对大规模多源异构的数据,数据挖掘的方法不断的得到改善与发展,同时对于数据挖掘体系的完善也提出了新的挑战.针对当前数据挖掘在大数据方面的应用,本文从数据挖掘的各个阶段进行了方法论的总结及应用,主要包括数据准备的方法.数据探索的方法.关联规则方法.数据回归方法.数据分类方法.数据聚类方法.数据预测方法和数据诊断方法.最后还指出类数据挖掘在鲁棒性表达方面的进一步研究. 关键词: 数据挖掘;方法论;大数据;鲁棒性 Application of D

[数据分析工具] Pandas 功能介绍(二)

条件过滤 我们需要看第一季度的数据是怎样的,就需要使用条件过滤 体感的舒适适湿度是40-70,我们试着过滤出体感舒适湿度的数据 最后整合上面两种条件,在一季度体感湿度比较舒适的数据 列排序 数据按照某列进行排序 “by”参数可以使用字符串,也可以是列表,ascending 的参数也可以是单个值或者列表 ascending 默认值是 True 列中的每行上的 apply 函数 在前一篇的增加列的部分,根据风速计算人体感觉是否舒适,为了功能的演示,在这里使用 DataFrame 的 apply 方法