我根据这里描述的方法创建了一个时间序列模型,生成的代码如下:
var data = items.ToArray();var trainData = mlContext.Data.LoadFromEnumerable(data);var estimator = mlContext.Forecasting.ForecastBySsa( nameof(FooPrediction.BarPrediction), nameof(FooInput.Bar), 12, data.Length, data.Length, 2, confidenceLowerBoundColumn: nameof(FooPrediction.ConfidenceLowerBound), confidenceUpperBoundColumn: nameof(FooPrediction.ConfidenceUpperBound));var transformer = estimator.Fit(trainData);using var engine = transformer.CreateTimeSeriesEngine<FooInput, FooPrediction>(mlContext);engine.CheckPoint(mlContext, "model.zip");
其中items
是IEnumerable<FooInput>
。这些是我的模型类:
public class FooPrediction{ public float[] BarPrediction { get; set; } public float[] ConfidenceLowerBound { get; set; } public float[] ConfidenceUpperBound { get; set; }}public class FooInput{ public float Bar { get; set; } public float Baz { get; set; }}
在我的Startup
中,我这样添加PredictionEnginePool
:
services.AddPredictionEnginePool<FooInput, FooPrediction>().FromFile(String.Empty, "model.zip", true);
在我的中间件服务中,我注入了PredictionEnginePool
,然后调用:
var prediction = items.Select(i => predictionEnginePool.Predict(i));
其中items
是IEnumerable<FooInput>
。
这导致在PredictionEngineBase.TransformerChecker
中抛出了ArgumentOutOfRangeException
:
必须是行到行的映射器(参数 ‘transformer’)
调试代码时,我可以看到对ITransformer
对象的IsRowToRowMapper
属性的检查为真。然而,当模型创建时,创建了一个SsaForecastingTransformer
,其此属性被设置为false。
我做错了什么,还是PredictionEnginePool
不支持时间序列模型?
我还尝试了AddPredictionEnginePool<IEnumerable<FooInput>, FooPrediction>
,然后调用predictionEnginePool.Predict(items)
,但这也导致了相同的异常。
回答:
这段代码是在我之后添加的,所以我没有第一手的知识。
但是,据我所知ML.NET,答案是肯定的:很可能PredictionEnginePool
不支持时间序列预测。
原因是,时间序列预测引擎实际上是一个“状态机”。你需要将所有数据,按照正确的顺序,喂给一个预测引擎,这样它才能正确地响应这个“时间序列”。
预测引擎池解决的是完全不同的场景:如果你有真正无状态的模型,你可以实例化几个可互换的预测引擎实例(一个池),预测将由当前空闲的引擎处理。
这些“无状态”模型在代码库中由“行到行映射器”概念表示。基本上,这个模型的预测完全且仅基于一行数据决定。