为每种参数组合创建未来的时间戳

我想知道如何为每种参数组合(BranchId, Hour, weekdays)创建未来的时间戳。

BranchId      Hour   weekdays     ActivityDate     Total       1          11      3      2018-02-06T00:00:00   18    1          11      3      2018-02-13T00:00:00   23    1          12      3      2018-02-06T00:00:00   15    1          12      3      2018-02-13T00:00:00   13    1          13      3      2018-02-06T00:00:00   24    1          13      3      2018-02-13T00:00:00   22

目前我只能为一种组合创建未来的时间戳,如下所示:

BranchId    Hour    weekdays    ActivityDate       Total    1        11        3     2018-02-06T00:00:00Z   18    1        11        3     2018-02-13T00:00:00Z   23    1        11        3     2018-02-20T00:00:00Z       1        11        3     2018-02-27T00:00:00Z       1        11        3     2018-03-06T00:00:00Z       1        11        3     2018-03-13T00:00:00Z   

代码如下:

min.date <- min(data$ActivityDate)max.date <- max(data$ActivityDate)unique.time <- seq(from = min.date,  to = max.date, by = "week")forecast.time <- seq(from = max.date, by = observation.freq, length.out = 4 + 1)[-1]all.time <- c(unique.time, forecast.time)all.time <- data.frame(BranchId = data$BranchId[1], Hour = data$Hour[1], weekdays = data$weekdays[1],ActivityDate = all.time)# Join the combination with original datadata <- join(all.time, data, by = c("BranchId","Hour", "weekdays", "ActivityDate"), type = "left")

当我将此代码应用于数据时,结果出现了错误,它不会为每种组合创建未来的时间戳:

BranchId    Hour    weekdays    ActivityDate      Total   1         11        3    2018-02-06T00:00:00Z    18   1         11        3    2018-02-13T00:00:00Z    23   1         12        3    2018-02-20T00:00:00Z       1         12        3    2018-02-27T00:00:00Z       1         13        3    2018-03-06T00:00:00Z       1         13        3    2018-03-13T00:00:00Z    

我是否需要生成多个函数或使用for循环来解决这个问题?


回答:

在R语言中使用complete函数

df%>%group_by(BranchId,Hour,weekdays)%>%complete(ActivityDate = seq.Date(min(ActivityDate), min(ActivityDate)+42, by="week"),fill=list(Total=0))# A tibble: 21 x 5# Groups:   BranchId, Hour, weekdays [3]   BranchId  Hour weekdays ActivityDate Total      <int> <int>    <int>       <date> <dbl> 1        1    11        3   2018-02-06    18 2        1    11        3   2018-02-13    23 3        1    11        3   2018-02-20     0 4        1    11        3   2018-02-27     0 5        1    11        3   2018-03-06     0 6        1    11        3   2018-03-13     0 7        1    11        3   2018-03-20     0 8        1    12        3   2018-02-06    15 9        1    12        3   2018-02-13    1310        1    12        3   2018-02-20     0

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注