我遇到了一个问题,不知道如何在机器学习模型中使用列表作为标签。我有一个如下所示的数据框:
我的特征集是一组数字,我的标签也是一组数字。我该如何将两者关联起来?我已经处理过二元标签,但对于非二元标签却束手无策。
附注:我知道我的数据缺乏预处理,由于处理速度的原因,我只加载了整个数据的一小部分进行处理
编辑 – 抱歉之前没有解释清楚:每个数字代表一个词。我的特征集是一段文本,我的标签是一个标题。我正在尝试构建一个模型,根据训练的模型,给定一段文本,生成一个标题
回答:
你可以尝试使用sklearn的MultiLabelBinarizer()
。请查看这篇文章