如何将文本数据转换为LibSVM文件格式以训练垃圾邮件分类的模型?SVM文件是否已经标记?
回答:
SVM格式既不是必需的,也不是特别有用。它在Apache Spark ML示例中被使用,仅仅因为它可以直接映射到所需的格式。
SVM文件是否已经标记?
不一定,但Spark只能读取已标记的变体。
在实践中,您应该使用org.apache.spark.ml.feature
工具从您的数据中提取相关特征。
您可以参考文档以及Stack Overflow上的多个问题。
如何将文本数据转换为LibSVM文件格式以训练垃圾邮件分类的模型?SVM文件是否已经标记?
回答:
SVM格式既不是必需的,也不是特别有用。它在Apache Spark ML示例中被使用,仅仅因为它可以直接映射到所需的格式。
SVM文件是否已经标记?
不一定,但Spark只能读取已标记的变体。
在实践中,您应该使用org.apache.spark.ml.feature
工具从您的数据中提取相关特征。
您可以参考文档以及Stack Overflow上的多个问题。