正确的方法将 cutoff_time 传递给 featuretools 1.0.0 中的 dfs

最近我更新了 featuretools 到 v1.0.0 版本,并遇到了以下问题。我有一些随时间变化的实例,我希望为它们构建依赖于时间的特征。此外,我还希望保存这些实例的一些历史特征。因此,我的截止时间数据集包括以下列:时间、实例ID以及特征1、特征2、…、目标

当我尝试运行 dfs 时,遇到了错误 'NoneType' object has no attribute 'logical_types'

我发现这是由内部函数 get_ww_types_from_features 引起的

它试图获取截止时间数据框的列类型,假设它具有 woodwork 类型

        cutoff_schema = cutoff_time.ww.schema        for column in pass_columns:            logical_types[column] = cutoff_schema.logical_types[column]            semantic_tags[column] = cutoff_schema.semantic_tags[column]            origins[column] = "base"

但最初的截止时间是一个 pandas 数据框,我在代码中没有找到将其转换为 woodwork 的地方。此外,文档中也提到可以将截止时间作为 pandas 数据框传递是可以的

因此,我的疑问是:传递截止时间数据框的正确方法是什么?(如果是 pandas,是否代码中有错误?)或者如果没有错误,那么在 dfs 之前我是否需要手动将截止时间转换为 woodwork?


回答:

在 Featuretools 1.0.0 中,当使用包含额外列(例如标签)的数据框作为 cutoff_time 并通过 n_jobsdask_kwargs 选项使用多个工作线程时,存在一个错误。这可能是您遇到的问题。这个错误已在 Featuretools 1.1.0 中修复

在 1.0.0 版本中,pandas 数据框是可以作为 cutoff_time 接受的

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注