我使用RapidMiner尝试了许多算法后训练了一个分类器模型,并在我的数据集上进行了评估。我还将模型从RapidMiner导出为XML和pkl文件,但在我的Python程序(scikit-learn)中无法读取这些文件。有没有办法在Python程序中导入RapidMiner的分类器/模型,并在我的最终应用中使用它来预测或分类新数据?
回答:
实际上,我认为不行——如果你想在scikit-learn中使用模型,不如从一开始就在那里训练模型。
你的RapidMiner模型是一种对象。你导出的两种格式只是存储方法。Scikit-learn模型是另一种对象。你不能直接保存一种并加载到另一种中。一个类似的例子是询问你是否可以将飞机引擎装载到火车上。
要做到你所要求的,你需要获取分类器保存的底层数据,找出其格式,然后想办法将其转换成与scikit-learn分类器相同的格式。这取决于你使用的分类器类型。例如,如果你使用的是贝叶斯模型,你可以设法捕获先验概率并使用它们,但这并不简单。