我可能在问一个简单的问题,但这个答案对我来说非常重要。我对机器学习非常新手。我已经阅读了关于监督学习的内容,并且了解这些算法的基础知识。我的问题是,当我在数据集上使用像j48这样的算法时,如何找到指定的函数,以便稍后用于分类未标记的数据。
提前感谢您
回答:
您提到的“函数”实际上就是分类器本身。它是在训练过程中被学习的。因此,为了使用您的模型对新数据进行分类,您需要将其保存到磁盘/数据库中。如何做呢?这完全取决于所使用的语言/实现方式。在Python中,您可以简单地将对象进行序列化(pickle)。在Java中,您可以序列化您的训练对象,或者使用Weka来学习j48决策树并保存以便稍后使用:https://weka.wikispaces.com/Saving+and+loading+models