resample(resample函数的作用)

resample(resample函数的作用)

python中resample函数实现重采样和降采样代码

  函数原型

  resample(self, rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention=‘start’, kind=None, loffset=None, limit=None, base=0, on=None, level=None)

  比较关键的是rule,closed,label下面会随着两个用法说明

  降采样

  对时间数据细粒度增大,可以把每天的数据聚合成一周,可以求和或者均值的方式进行聚合

  下面给出列子

  我们看看上面代码,就是先给出一个1-30号的series,l然后聚合成左闭右开的5个区间[1,8),[8,15),[15,22),[22-29),[29-5(下个月)),每个区间的值就为单个区间值之和。由于29号往后只有29号和30号有值,所以只有两个值

  下面我们看看label和closed的功能

  上面的代码,将closed改为了right,区间就变成了左开右闭,那么如果从区间还是(1,8],1就取不到,所以往前取,就是(25,1],(1,8],(8,15],(15,22],(22,29],(29,5]这6个区间

  上面的代码就可以看出label=right就是指label等于右区间的值,如果label=left就是指label等于左区间的值

  重采样

  降低时间的细粒度,对于重采样,主要是涉及到值的填充。有下面的三种填充方法

  不填充。那么对应无值的地方,用NaN代替。对应的方法是asfreq。

  用前值填充。用前面的值填充无值的地方。对应的方法是ffill或者pad。

  用后值填充。对应的方法是bfill,b代表back。

  下面给出代码看一下

  总结

  重采样和降采样一般用在时间序列里面,合理的使用降低时间维度或者降低时间细粒度多可以成为好的特征。

  以上这篇python中resample函数实现重采样和降采样代码就是小编分享给大家的全部内容了,希望能给大家一个参考。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/23539.html

(0)
上一篇 2023-10-24 19:30
下一篇 2023-10-25

相关推荐