如何将月度数据转换成日度数据?

Rex不辣不辣

共 953字,需浏览 2分钟

 ·

2022-02-20 10:11

当我准备用LSTM神经网络模型去预测商品的价格的时候,其中考虑到了与商品有关的如销量,价格,人均可支配收入,cpi等维度。问题是这些维度有一些是以天为单位的,有些是以月为单位的,只有统一了单位才可以进行模型训练。我看到有很多类似价格预测的文献里,作者有提到用插值法将月度数据转换为日度数据,但是没有提到具体怎么操作。我在百度上搜,大多数是将日度数据转换成月度数据,很少看见有用的方法。今天这里就想教大家怎么将月度数据合理的转换成日度数据。假如我们有以下月度数据:

 68a0478190467c3fcefdd295456bfca5.webp

该如何将他们转成日度数据呢?

方法一: 

当月的每一天都按照月度数据填补,如:

 

85e23b6f31d61a2b6a44733f7eaa583b.webp

这样操作起来最简单,但是失去了一些数据的规律性和连贯性。

方法二:

插值法(interpolation),如:

 

d58859662cf49ae0859a8017af6c1fe2.webp

这样是不是就看起来合理了许多,但是可能离真实情况可能还是有很大差别,但是比方法一更容易接受和理解。

俗话说,巧妇难为无米之炊。当我们缺少需要的日度数据的时候,用插值法就是一个很好的办法。

下面是具体的例子:

import pandas as pd import numpy as npimport matplotlib.pyplot as pltdf=pd.read_excel('cpi 月.xlsx')y1=df['fruit_cpi']x1=df['Date']plt.plot(x1,y1)df.shape

758bc7a0a2d2bedef0df1c867b197743.webp

 

df1=df.set_index('Date').resample('D').interpolate()date = pd.date_range(start='04/01/2018', periods=len(df1.index))df1.insert(0,'Date',date,True)
y_afterIp=df1['fruit_cpi']x_afterIp=df1['Date']plt.plot(x_afterIp,y_afterIp)df1.shape

1e3cc16e95ccb8c224927557b244c3a4.webp

 

数据的行数就从36变到了1066,意味着我们把三年的月度数据转换成了三年的日度数据。而plot出来的图与之前并没有什么大的改变,意味着我们保留了数据的规律性。

如果有不足之处,欢迎评论区里指出来,十分感谢🙏。




浏览 126
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报