如何提供Spark MLlib模型服务?

我在评估用于生产环境的机器学习应用工具,其中一个选项是…

无法训练pySpark SVM,标记点问题

我正在尝试将一个Spark Dataframe转换为标…

在Spark MLlib中,LogisticRegressionWithSGD能否执行多分类任务?

我想使用LogisticRegressionWithS…

spark词频转换

我有一组句子中的词,已经进行了分词并应用了词频转换。 …

什么情况下不应该使用Spark MMLIB

我想了解在哪些情况下不应该使用Spark MMLIB。…

聚类场景:作为点之间相似性度量的两个点的计算成本之间的差异。这是否适用?

我想在聚类中的两个点之间有一个相似性的度量。这样计算出…

pyspark : NameError: 名称 ‘spark’ 未定义

我正在从官方文档网站复制pyspark.ml的示例:h…

Pyspark – 获取使用ParamGridBuilder创建的模型的所有参数

我在使用PySpark 2.0参加Kaggle竞赛。我…

使用Spark ML进行文本分类

我有一段基于免费文本描述的分类需求。例如,描述可能是关…

如何将MLlib Apache Spark库安装到JAVA Eclipse项目中?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

如何在Java Spark中读取文本文件并将其转换为Dataset?

我想在我的Java Spark项目中读取两个包含数据的…

使用KDDCup 99数据与Spark MLLib随机森林

我在机器学习项目中尝试使用KDDCup 99数据。我决…

从序列平均预测下一个事件

我在机器学习方面还是新手,所以在尝试理解如何使用Spa…

Spark MLLib 2.0 管道中的分类特征

我正在尝试基于日志文件构建决策树。某些特征集很大,包含…

如何为二分类选择平衡抽样?

这是我的代码,用于从Hive加载数据并进行样本平衡: …

如何在Spark MLlib中对LogisticRegressionWithLBFGS使用L1正则化

官方文档中提到:默认使用L2正则化 如何使用L1正则化…

Spark ALS predictAll返回空

我有以下Python测试代码(ALS.train的参数…

在这种情况下应该使用哪种分类器或机器学习SDK?

训练数据(包括训练集和验证集)大约有80百万个样本,每…

Spark MLLib: 将任意稀疏特征转换为固定长度的Vector

我们正在将一个在线机器学习的线性回归模型从Vowpal…

KMeans||用于Spark上的情感分析

我正在尝试基于Spark编写一个情感分析程序。为此,我…

SPARK ML,朴素贝叶斯分类器:对一个类别的高概率预测

我正在使用Spark ML来优化一个多类别的朴素贝叶斯…

文本分类 – 如何处理

我会尽力描述我的想法。 在MS SQL数据库中存储了文…

Spark mllib LinearRegression 奇怪的结果

我从一个示例开始尝试进行线性回归。问题是我得到了错误的…

多标签的Logistic Regression在PySpark MLlib中的问题

我在尝试创建一个LogisticRegression模…

如何在pyspark中使用LogisticRegressionWithLBFGS打印预测的概率

我正在使用Spark 1.5.1,在pyspark中,…