我在R中尝试对一个大约40000行的数据集(通过data.table包上传)运行stemmer函数,但运行时间非常长。我的代码如下所示:
data[, Description := map(Description, function(k) stemmer(k))]
如果手动停止这个过程,会显示超过50个警告,如下图所示:图片链接
有没有什么替代方法可以让它运行得更快?我电脑的内存是8GB。
回答:
使用lapply
,你的函数会运行得更快
我在R中尝试对一个大约40000行的数据集(通过data.table包上传)运行stemmer函数,但运行时间非常长。我的代码如下所示:
data[, Description := map(Description, function(k) stemmer(k))]
如果手动停止这个过程,会显示超过50个警告,如下图所示:图片链接
有没有什么替代方法可以让它运行得更快?我电脑的内存是8GB。
回答:
使用lapply
,你的函数会运行得更快