在R中处理ID变量和因子

我有一个数据集，想构建一些模型并进行比较。

然而，我对如何处理产品ID这个独立变量感到相当困惑。

我有这个数据集，所有的变量都是数值型的，但产品ID变量是整数类型，如下所示：

str(data)'data.frame':   16 obs. of  6 variables:                                                                        $ Productid: int  1 2 3 4 5 6 7 8 9 10 ...                                                                                 $ x1       : num  6.21 7.75 7.21 8.33 4.87 5.09 6.04 6.09 6.08 6.17 ...                                                           $ x2       : num  7.08 3.29 4.38 2.79 7.71 7.5 6.58 5.13 5.5 5.58 ...                                                             $ x3       : num  2 1.54 1.79 1.63 1.96 2.13 2.04 2 2.09 2.13 ...                                                      $ x4       : num  2.54 2.26 2.58 2.71 1.7 2.42 2.04 2.42 2.46 2.48 ...                                                       $ Y        : num  4.97 6.98 4.58 6.45 4.33 4.26 6.16 6.26 5.83 5.74 ...

如何处理这个产品ID？我应该使用独热编码吗？

如果解决方案是将其转换为因子，哪些机器学习算法接受因子？

回答：

ID只是用来识别产品的，对因变量没有任何影响，因此不应该包含在任何模型中。

学技术

在R中处理ID变量和因子

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复