我有一组数据,包含用户通过选择完成的问题和答案。我试图…
data.rdd.getNumPartitions()…
能否将训练好的Spark ML模型或交叉验证器保存到P…
我有一个如图所示的数据框。我想从中创建一个训练集和一个…
我已经设置了数据来输入Apache Spark LDA…
我之前使用Scikit-learn来运行机器学习算法,…
我使用以下代码通过交叉验证来训练线性回归模型: fro…
我使用以下代码从https://spark.apach…
我正在尝试创建一个Pyspark管道来运行一个分类模型…
我遇到了以下错误: AssertionError: 维…
我有一个包含5000行和401列的训练集,其中第一列是…
我在Mac上运行Spark 2.1.1,操作系统是Si…
问题: pyspark和scikit-learn中逻辑…
我正在使用pyspark.ml.clustering库…
我参考了一篇帖子,尝试并行运行 KMeans。我使用的…
在对 pyspark dataframe 进行预处理后…
我在Python中使用的是Spark 2.0.1版本,…
我在使用Spark的ML库进行决策树的交叉验证时,调用…
我在学习使用PySpark进行机器学习。我有一个数据集…
我已经尝试了几天在Spark的map函数中运行机器学习…
我正在进行文本分类,并使用pipeline方法构建了一…
我有一个包含15列的数据框(其中4列为分类变量,其余为…
我对Spark完全是新手,目前正在尝试使用Python…
我对机器学习和Spark ML都比较新手,正在尝试使用…
from pyspark.ml.regression …