当我尝试在X_train和y_train上拟合模型时,出现了如图所示的错误。术语“Alberta”是数据集中省份列的一个条目。这里我使用了决策树和随机森林,因为这是一个不平衡的数据集。请帮助我解决这个错误。我不知道我哪里做错了..
回答:
这可能是由于数据集中既有数值又有字符串造成的。我建议的一些解决方案是:
- 浏览数据集并删除不必要的特征/列(要小心不要删除重要的特征)。
- 将分类类型的列转换为数值以去除字符串。
当我尝试在X_train和y_train上拟合模型时,出现了如图所示的错误。术语“Alberta”是数据集中省份列的一个条目。这里我使用了决策树和随机森林,因为这是一个不平衡的数据集。请帮助我解决这个错误。我不知道我哪里做错了..
回答:
这可能是由于数据集中既有数值又有字符串造成的。我建议的一些解决方案是: