如何将R语言文本挖掘中获得的术语文档矩阵转换为Excel或CSV文件?

更具体地说,假设我有一个名为”names”的字符向量,包含以下元素:

Names[1]<-"aaron, matt, patrick",Names[2]<-"jiah, ron, melissa, john, patrick"

依此类推……我有22956个这样的元素。我想将所有名字分开,并在Excel中为每个名字分配一个单独的列。我该怎么做?这需要进行文本挖掘。但我不确定该如何操作。

谢谢你。


回答:

我假设你有一组由逗号分隔的字符串元素,每组元素的数量不同。

Names <- c("aaron, matt, patrick",           "jiah, ron, melissa, john, patrick")## get max number of elementsmm <-  mm <- max(unlist(lapply(strsplit(Names,','),length)))## set all rows the same lengthlapply(strsplit(Names,','),function(x) {length(x) <- mm;x})## create a data frame with the data welle formattedres <- do.call(rbind,lapply(strsplit(Names,','),function(x) {length(x) <- mm;x}))## save the filewrite.csv(res,'output.csv')

我认为你也可以使用plyr包中的rbind.fill,但你需要将每一行转换为data.frame(这会有一定的成本)。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注