理解Keras在R中RNN模型的预测输出

我正在通过这个教程尝试使用R中的Keras包来预测温度。然而,教程中没有解释如何使用训练好的RNN模型进行预测,我很想知道该如何操作。我使用了教程中复制的以下代码来训练模型:

dir.create("~/Downloads/jena_climate", recursive = TRUE)download.file(    "https://s3.amazonaws.com/keras-datasets/jena_climate_2009_2016.csv.zip",      "~/Downloads/jena_climate/jena_climate_2009_2016.csv.zip"    )unzip(  "~/Downloads/jena_climate/jena_climate_2009_2016.csv.zip",  exdir = "~/Downloads/jena_climate")library(readr)data_dir <- "~/Downloads/jena_climate"fname <- file.path(data_dir, "jena_climate_2009_2016.csv")data <- read_csv(fname)data <- data.matrix(data[,-1])train_data <- data[1:200000,]mean <- apply(train_data, 2, mean)std <- apply(train_data, 2, sd)data <- scale(data, center = mean, scale = std)generator <- function(data, lookback, delay, min_index, max_index,                      shuffle = FALSE, batch_size = 128, step = 6) {  if (is.null(max_index))    max_index <- nrow(data) - delay - 1  i <- min_index + lookback  function() {    if (shuffle) {      rows <- sample(c((min_index+lookback):max_index), size = batch_size)    } else {      if (i + batch_size >= max_index)        i <<- min_index + lookback      rows <- c(i:min(i+batch_size, max_index))      i <<- i + length(rows)    }    samples <- array(0, dim = c(length(rows),                                 lookback / step,                                dim(data)[[-1]]))    targets <- array(0, dim = c(length(rows)))    for (j in 1:length(rows)) {      indices <- seq(rows[[j]] - lookback, rows[[j]],                      length.out = dim(samples)[[2]])      samples[j,,] <- data[indices,]      targets[[j]] <- data[rows[[j]] + delay,2]    }                list(samples, targets)  }}lookback <- 1440step <- 6delay <- 144batch_size <- 128train_gen <- generator(  data,  lookback = lookback,  delay = delay,  min_index = 1,  max_index = 200000,  shuffle = TRUE,  step = step,   batch_size = batch_size)val_gen = generator(  data,  lookback = lookback,  delay = delay,  min_index = 200001,  max_index = 300000,  step = step,  batch_size = batch_size)test_gen <- generator(  data,  lookback = lookback,  delay = delay,  min_index = 300001,  max_index = NULL,  step = step,  batch_size = batch_size)# How many steps to draw from val_gen in order to see the entire validation setval_steps <- (300000 - 200001 - lookback) / batch_size# How many steps to draw from test_gen in order to see the entire test settest_steps <- (nrow(data) - 300001 - lookback) / batch_sizelibrary(keras)model <- keras_model_sequential() %>%   layer_flatten(input_shape = c(lookback / step, dim(data)[-1])) %>%   layer_dense(units = 32, activation = "relu") %>%   layer_dense(units = 1)model %>% compile(  optimizer = optimizer_rmsprop(),  loss = "mae")history <- model %>% fit_generator(  train_gen,  steps_per_epoch = 500,  epochs = 20,  validation_data = val_gen,  validation_steps = val_steps)

我尝试使用下面的代码来预测温度。如果我理解正确,这应该会为每个批次提供归一化的预测温度。因此,当我对这些值进行反归一化并求平均值时,我就能得到预测的温度。这是正确的吗?如果是,那么预测的时间是(最新观测时间 + delay)吗?

prediction.set <- test_gen()[[1]]prediction <- predict(model, prediction.set)

此外,如何正确使用 keras::predict_generator()test_gen() 函数?如果我使用以下代码:

model %>% predict_generator(generator = test_gen,                            steps = test_steps)

它会返回以下错误:

error in py_call_impl(callable, dots$args, dots$keywords) :  ValueError: Error when checking model input: the list of Numpy arrays that you are passing to your model is not the size the model expected.  Expected to see 1 array(s), but instead got the following list of 2 arrays:  [array([[[ 0.50394005,  0.6441838 ,  0.5990761 , ...,  0.22060473,          0.2018686 , -1.7336458 ],        [ 0.5475698 ,  0.63853574,  0.5890239 , ..., -0.45618412,         -0.45030192, -1.724062...

回答:

注意:我对R的语法不太熟悉,所以遗憾的是我无法使用R来回答您的问题。相反,我在回答中使用了Python。我希望您能轻松地将我的话至少翻译回R。


… 如果我理解正确,这应该会为每个批次提供归一化的预测温度。

是的,没错。由于您使用归一化的标签进行训练,因此预测值将是归一化的:

data <- scale(data, center = mean, scale = std)

因此,您需要使用计算出的均值和标准差对值进行反归一化以找到真实的预测值:

pred = model.predict(test_data)denorm_pred = pred * std + mean

… 那么预测的时间是(最新观测时间 + delay?)

没错。具体来说,由于在这个特定数据集中每十分钟记录一个新的观测值,并且您设置了delay=144,这意味着预测值是从最后一个给定观测值开始24小时后的温度(即144 * 10 = 1440分钟 = 24小时)。

此外,如何正确使用keras::predict_generator()test_gen()函数?

predict_generator 需要一个仅输出测试样本的生成器,而不输出标签(因为我们在进行预测时不需要标签;在训练时需要标签,即fit_generator(),以及在评估模型时,即evaluate_generator())。这就是为什么错误消息提到您需要传递一个数组而不是两个数组的原因。因此,您需要定义一个仅提供测试样本的生成器,或者在Python中另一种方法是将现有生成器包装在另一个仅输出输入样本的函数中(我不知道您是否可以在R中这样做):

def pred_generator(gen):    for data, labels in gen:        yield data  # 丢弃标签spreds = model.predict_generator(pred_generator(test_generator), number_of_steps)

您需要提供另一个参数,即生成器的步骤数,以覆盖测试数据中的所有样本。实际上,我们有num_steps = total_number_of_samples / batch_size。例如,如果您有1000个样本,并且生成器每次生成10个样本,您需要使用生成器进行1000 / 10 = 100个步骤。

附加内容: 要查看您的模型性能如何,您可以使用现有的测试生成器(即test_gen)来使用evaluate_generator

loss = model.evaluate_generator(test_gen, number_of_steps)

给定的loss也是归一化的,要对其进行反归一化(以更好地了解预测误差),您只需将其乘以std(您不需要加上mean,因为您使用mae,即平均绝对误差,作为损失函数):

denorm_loss = loss * std

这将告诉您预测平均偏差多少。例如,如果您在预测温度,denorm_loss为5意味着预测平均偏差5度(即比实际值少或多5度)。


更新: 对于预测,您可以在R中使用现有生成器定义一个新的生成器,如下所示:

pred_generator <- function(gen) {  function() { # 包装在一个函数中使其可调用    gen()[1]  # 调用给定的生成器并获取第一个元素(即样本)  }}preds <- model %>%   predict_generator(    generator = pred_generator(test_gen), # 直接将test_gen传递给pred_generator而不调用它    steps = test_steps  )evaluate_generator(model, test_gen, test_steps)

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注