hadoop – 学技术

IT技术

Pyspark ML错误：对象没有属性map

xiaolong · 2025年4月14日 · 0 Comment

以下是我的数据框和代码 df= a b c d 1 3…

IT技术

在Hive中是否可以实现’归一化’的dense_rank()？

xiaolong · 2025年4月12日 · 0 Comment

我有一个如下所示的消费者表格。 consumer | …

IT技术

在Yarn上运行Spark官方Python机器学习示例失败

xiaolong · 2025年4月12日 · 0 Comment

我可以通过以下命令成功在Yarn上运行pi.py示例：…

IT技术

在Mapper中将字符串化的MapWritable转换为对象

xiaolong · 2025年4月12日 · 0 Comment

实际上，我正在尝试实现一个机器学习算法，该算法要求我在…

IT技术

如何将包含时间戳等的CSV文件输入到mahout中以实现相似度功能等？

xiaolong · 2025年4月10日 · 0 Comment

目前，我正在尝试将我的数据输入以进行机器学习实验，数据…

IT技术

将Spark ML模型保存到HDFS

xiaolong · 2025年4月10日 · 0 Comment

我试图将从Spark ML库创建的模型对象保存起来。 …

IT技术

在RStudio中无法处理大型文件

xiaolong · 2025年4月9日 · 0 Comment

已关闭。此问题需要更多细节或更清晰。目前不接受回答。 …

IT技术

如何在Apache Mahout中合并两个相似性实例

xiaolong · 2025年4月7日 · 0 Comment

我是Apache Mahout的新手，有一个问题想请教…

IT技术

Hadoop vs Mahout 和机器学习问题？

xiaolong · 2025年4月7日 · 0 Comment

我在研究使用mahout进行数据科学和机器学习开发时，…

IT技术

如何解决在Twenty Newsgroups分类示例中加载主类MahoutDriver的错误

xiaolong · 2025年4月7日 · 0 Comment

我在尝试运行Mahout中的2newsgroup分类示…

IT技术

在不同平台上使用PMML模型进行评分的差异

xiaolong · 2025年4月7日 · 0 Comment

我在R中构建了一个玩具版的随机森林模型（使用caret…

IT技术

如何从tsv文件创建用于文本分类的序列文件

xiaolong · 2025年4月7日 · 0 Comment

我有一个tsv文件，文件中包含类别、ID和文本三列，例…

IT技术

将Scikit Learn随机森林导出用于Hadoop平台

xiaolong · 2025年4月7日 · 0 Comment

我使用pandas和scikit learn开发了一个…

IT技术

关于使用Mahout与Hadoop的使用说明

xiaolong · 2025年4月7日 · 0 Comment

我目前使用Mahout的内存推荐API实现了一个推荐器…

IT技术

大数据与数据挖掘有什么区别？

xiaolong · 2025年4月7日 · 0 Comment

已关闭。此问题属于基于意见的问题。目前不接受回答。想…

IT技术

Mahout – 朴素贝叶斯模型非常慢

xiaolong · 2025年4月7日 · 0 Comment

我有大约4400万个训练样本，分布在约6200个类别中…

IT技术

为什么在Spark中，lines.map不起作用，而lines.take.map却能工作？

xiaolong · 2025年4月7日 · 0 Comment

我是Scala和Spark的新手。我正在练习使用Sp…

IT技术

在100 TB数据上进行机器学习的正确数据库

xiaolong · 2025年4月7日 · 0 Comment

我需要对大约100 TB的网络数据进行分类和聚类分析，…

IT技术

地图归约/Hadoop在机器学习训练中的应用？

xiaolong · 2025年4月7日 · 0 Comment

地图归约/Hadoop非常适合从各种资源的大量数据中获…

IT技术

Mahout+Hadoop在Windows上的使用

xiaolong · 2025年4月7日 · 0 Comment

我想使用大规模的机器学习算法，并希望使用Mahout来…

IT技术

使用Mahout进行数据分类

xiaolong · 2025年4月7日 · 0 Comment

我刚开始接触Apache Mahout，正在处理一个分…

IT技术

Hadoop: 使用多个树（例如采样N个，用于x个随机树）训练大数据（GB级别）并测试

xiaolong · 2025年4月7日 · 0 Comment

我想编写MapReduce程序（可能需要多轮）来 1….

IT技术

数据挖掘MPI库

xiaolong · 2025年4月7日 · 0 Comment

有没有使用MPI（消息传递接口）的数据挖掘库，或者可以…

IT技术

适用于Hadoop的入门项目

xiaolong · 2025年4月7日 · 0 Comment

我将在明年春天毕业。为了在明年的就业市场上具备竞争力，…

IT技术

Hadoop 或 Postgresql 用于有效处理

xiaolong · 2025年4月6日 · 0 Comment

我是一名学生，正在尝试对一个大型数据集使用一些机器学习…