我想预测一个时间序列值(回归任务)。但我需要告诉机器,在一个批次中,最近的观测值与标签的关系比旧的观测值更强。
换句话说——我想对输入值进行加权。这该如何实现?
回答:
你可以使用Y与自身的时间滞后进行自相关分析,例如:
time_lag=4x_train=dataframe[0:-timelag]y_train=dataframe[time_lag:]from pandas.plotting import autocorrelation_plotautocorrelation_plot(dataframe)
你会注意到,自相关值会随着时间距离的增加而减小。
然而,一个合适的神经网络会在不明确编程的情况下学会这一点,因为与近期值的相关性自然会更大,从而绝对值上的权重也会更大。