如何将R语言文本挖掘中获得的术语文档矩阵转换为Excel或CSV文件?

更具体地说,假设我有一个名为”names”的字符向量,包含以下元素:

Names[1]<-"aaron, matt, patrick",Names[2]<-"jiah, ron, melissa, john, patrick"

依此类推……我有22956个这样的元素。我想将所有名字分开,并在Excel中为每个名字分配一个单独的列。我该怎么做?这需要进行文本挖掘。但我不确定该如何操作。

谢谢你。


回答:

我假设你有一组由逗号分隔的字符串元素,每组元素的数量不同。

Names <- c("aaron, matt, patrick",           "jiah, ron, melissa, john, patrick")## get max number of elementsmm <-  mm <- max(unlist(lapply(strsplit(Names,','),length)))## set all rows the same lengthlapply(strsplit(Names,','),function(x) {length(x) <- mm;x})## create a data frame with the data welle formattedres <- do.call(rbind,lapply(strsplit(Names,','),function(x) {length(x) <- mm;x}))## save the filewrite.csv(res,'output.csv')

我认为你也可以使用plyr包中的rbind.fill,但你需要将每一行转换为data.frame(这会有一定的成本)。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注