我在机器学习领域还是一个初学者。假设有这样简单的数据:
+--------+--------+-----------------+| 年龄 | 性别 | 死亡率 |+--------+--------+-----------------+| 0 | 男性 | 0.01 || 30 | 女性 | 0.2 || 80 | 男性 | 30 |+--------+--------+-----------------+
为了根据年龄获得死亡率,我们可以使用回归分析,而根据性别则使用分类方法。将它们结合在一个机器学习算法中以生成输出预测的常用方法是什么?
回答:
你混淆了两件事:
-
输入数据类型
你有分类数据(性别)和离散数值特征(年龄)。
-
学习任务
分类:预测分类特征。回归:预测数值特征。
例如,决策树在分类任务中对分类输入效果最佳。支持向量机(SVM)对数值数据进行分类。支持向量回归(SVR)是SVM的回归变体。
我已经更新了你的问题标题。
你应该尝试的一种方法是将你的分类数据编码为二进制属性(例如,男性:1,女性:0),然后进行常规回归分析。