我需要使用ML.NET来处理大块文本,并确定任何给定文本块是否可能属于多个不同类别。
我目前有多个布尔列,当通过ML.NET找到匹配项时,我想将这些列标记为true。
我完全是机器学习的新手,在查阅分类示例时,似乎每块文本只能有一个分类。谁能指导我如何处理单个文本块的多个分类?或许能提供一些示例代码吗?
回答:
这是一个所谓的多分类问题。当我们处理一个布尔列时,那是二元情况,可以是“是”或“不是”,真或假。你需要做的不是这样,而是有一个类型列,包含多种可能的值,例如,每种类型的文本对应一个值。一个很好的例子是这里的问题分类器:
如果你习惯使用Jupyter Notebooks,这里是我创建的另一个示例:https://github.com/aslotte/mlnet-jupyter/blob/master/src/DataView/multi-class%20classification.ipynb
希望这对你有帮助!