pandas 时间序列resample

resample与groupby的区别:
resample:在给定的时间单位内重取样
groupby:对给定的数据条目进行统计

函数原型:
DataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention=‘start‘, kind=None, loffset=None, limit=None, base=0)
其中,参数how已经废弃了。

下面开始练习

import numpy as np
import pandas as pd

Start by creating a series with 9 one minute timestamps.

index = pd.date_range(‘1/1/2000‘, periods=9, freq=‘T‘)
series = pd.Series(range(9), index=index)

Downsample the series into 3 minute bins and sum the values of the timestamps falling into a bin.

series.resample(‘3T‘).sum()

To include this value close the right side of the bin interval as illustrated in the example below this one.

series.resample(‘3T‘, label=‘right‘).sum()

Downsample the series into 3 minute bins as above, but close the right side of the bin interval.

series.resample(‘3T‘, label=‘right‘, closed=‘right‘).sum()

Upsample the series into 30 second bins.

series.resample(‘30S‘).asfreq()

Upsample the series into 30 second bins and fill the NaN values using the pad method.

series.resample(‘30S‘).pad()

Upsample the series into 30 second bins and fill the NaN values using the bfill method.

series.resample(‘30S‘).bfill()

Pass a custom function via apply

def custom_resampler(array_like):
    return np.sum(array_like)+5

series.resample(‘3T‘).apply(custom_resampler)

附:常见时间频率
A year
M month
W week
D day
H hour
T minute
S second

时间: 2024-10-17 10:46:00

pandas 时间序列resample的相关文章

pandas的resample重采样

Pandas中的resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率转换的便捷的方法. 降采样:高频数据到低频数据 升采样:低频数据到高频数据 主要函数:resample()(pandas对象都会有这个方法) resample方法的参数 参数 说明 freq 表示重采样频率,例如'M'.'5min',Second(15) how='mean' 用于产生聚合值的函数名或数组函数,例如'mean'.'ohlc'.np.max等,默认是'mean',其他常用

pandas时间序列常用操作

目录 一.时间序列是什么 二.时间序列的选取 三.时间序列的生成 四.时间序列的偏移量 五.时间序列的前移或后移 五.时区处理 六.时期及算术运算 七.频率转换 一.时间序列是什么 时间序列在多个时间点观察或测量到的任何事物,很多都是固定频率出现 的,比如每15秒.每5分钟.每月. padnas提供了一组标准的时间序列处理工具和数据算法,基本的时间序列类型是以时间戳为索引的Series. 当创建一个带有DatetimeIndex的Series时,pandas就会知道对象是一个时间序列,用Nump

Python——Pandas 时间序列数据处理

介绍 Pandas 是非常著名的开源数据处理库,我们可以通过它完成对数据集进行快速读取.转换.过滤.分析等一系列操作.同样,Pandas 已经被证明为是非常强大的用于处理时间序列数据的工具.本节将介绍所有 Pandas 在时间序列数据上的处理方法. 知识点 创建时间对象 时间索引对象 时间算术方法 创建时间对象 在 Pandas 中关于时间序列的常见对象有 6 种,分别是 Timestamp(时间戳).DatetimeIndex(时间戳索引).Period(时间段).PeriodIndex(时间

Python Pandas 时间序列双轴折线图

时间序列pv-gmv双轴折线图 import numpy as np import pandas as pd import matplotlib.pyplot as plt n = 12 date_series = pd.date_range(start='2018-01-01', periods=n, freq="D") data = { 'pv': [10000, 12000, 13000, 11000, 9000, 16000, 10000, 12000, 13000, 1100

pandas时间序列滑窗

时间序列数据统计-滑动窗口 窗口函数 import pandas as pd import numpy as np ser_obj = pd.Series(np.random.randn(1000), index=pd.date_range('20180101', periods=1000)) ser_obj = ser_obj.cumsum() print(ser_obj.head()) 2018-01-01 0.797334 2018-01-02 0.451286 2018-01-03 1.

Pandas 时间序列数据绘制X轴主要刻度和次要刻度

先上效果图吧(图中Tue表示周二): Pandas和matplotlib.dates都是使用matplotlib.units来定位刻度. matplotlib.dates可以方便的手动设置刻度,同时pandas似乎可以自动调整格式. 直接上代码吧: # -*- coding: utf-8 -*- """ Created on Tue Dec 15 10:43:01 2015 @author: vgis """ import numpy as np

pandas resample 重采样

下方是pandas中resample方法的定义,帮助文档http://pandas.pydata.org/pandas-docs/stable/timeseries.html#resampling中有更加详细的解释. def resample(self, rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention='start', kind=None, loffset=None, limit=None

《利用python进行数据分析》读书笔记--第十章 时间序列(三)

7.时间序列绘图 pandas时间序列的绘图功能在日期格式化方面比matplotlib原生的要好. #-*- coding:utf-8 -*- import numpy as np import pandas as pd import matplotlib.pyplot as plt import datetime as dt from pandas import Series,DataFrame from datetime import datetime from dateutil.parse

pandas 常用函数整理

pandas常用函数整理,作为个人笔记. 仅标记函数大概用途做索引用,具体使用方式请参照pandas官方技术文档. 约定 from pandas import Series, DataFrame import pandas as pd import numpy as np 带.的为Series或者DataFrame对象的方法,只列举了部分关键字参数. 1.基础 .values 获取值,返回array对象 .index 获取(行)索引,返回索引对象 Series( index=) 创建Series