为什么Spark ML的ALS算法打印的RMSE = NaN?

我使用ALS来预测评分,这是我的代码: val als…

Spark ml pipeline在1.6版本中工作,但在2.0版本中无法工作。类型不匹配错误

大家好,我有以下在Spark 1.6中可以工作的代码。…

是否可以将Spark ML的CrossValidatorModel应用于Flink流数据流?

Flink是流处理的明显选择,然而Spark拥有成熟的…

Play Framework结合Spark MLib与PredictionIO

早上好, 目前我正在探索为我工作的公司构建内部平台的选…

Apache Flink ALS 使用 Long 类型而不是 Int 类型

我正在尝试使用 Flink 1.1.3 版本的 ALS…

Spark ML – KMeans – org.apache.spark.sql.AnalysisException: 无法解析’features’给定的输入列

我正在尝试使用Spark ML中的KMeans来分析和…

Spark 2.0 ALS推荐系统如何为用户推荐

我已经按照链接中给出的指南进行了操作 http://a…

Scala机器学习工具箱

已关闭。 此问题正在寻求关于软件库、教程、工具、书籍或…

无法将MongoDB中的数组传递到需要向量的Spark机器学习函数中

我的用例: 从MongoDB集合中读取以下形式的数据:…

使用Spark ML构建推荐系统

我正在按照文档示例构建一个推荐系统,我创建ALS构造函…

从按唯一ID分组的数据框中提取前n条记录

我的数据集如下所示 如你所见,数据是按评分和用户ID排…

Spark: 覆盖库方法

我想对spark.ml.classification….

闪亮水滴项目运行问题

我从’https://github.com…

使用reduceByKey()替代groupByKey()

这是对这里的跟进问题。我正在尝试基于这个实现来实现k-…

如何将linalg.Vector转换为regression.LabeledPoint格式?

我在spark-shell中尝试实现一个简单的机器学习…

高效从文本中提取WikiData实体

我有大量的文本(数百万),每个文本的长度在100到40…

KMeans||用于Spark上的情感分析

我正在尝试基于Spark编写一个情感分析程序。为此,我…

Spark mllib LinearRegression 奇怪的结果

我从一个示例开始尝试进行线性回归。问题是我得到了错误的…

最快的句子词形还原方法

我目前正在构建一个分类管道,现在发现corenlp词形…

coreNLP严重拖慢Spark作业`

我正在尝试创建一个通过将文档切分成句子,然后对句子中的…

如何使用 RowMatrix.columnSimilarities(相似性搜索)

简而言之: 我试图基于一个现有的数据集(Seq[Wor…

从FlinkML多元线性回归中提取权重

我在运行Flink(0.10-SNAPSHOT)的多元…

如何将elastic4s的ElasticSearch客户端序列化以与Spark RDD一起运行?

目前我在数百万用户和产品上运行Spark Mllib的…

在Spark上递归构建决策树时,是否需要保存中间数据子集?

我在一个50节点的集群上使用Scala/Spark构建…

如何在MLBase中将分类变量转换为虚拟/指示变量

我在尝试使用MLBase中的逻辑回归模型来预测广告的点…