对于生存分析,我使用了 R 语言的 mlr3proba
包。
我的数据集包含 39 个特征(包括连续和因子型,我已将其全部转换为整数和数值类型)以及目标变量(时间和状态)。
我想调整超参数:num_nodes
,在 Param_set
中。
这是一个 ParamUty
类参数,默认值为:32,32
。
因此,我决定对其进行转换。
我编写了以下代码,用于使用 ‘嵌套交叉验证’(内部10折,外层3折)优化 surv.deephit
学习器的超参数。
#task definitiontask.mlr <- TaskSurv$new(id = "id", backend = main.dataset, event = 'status', time = 'time')#learner definitiondh.learner <- lrn('surv.deephit') #resampling methodresampling <- rsmp('cv', folds =10) #tuner methodtuner <- tnr('random_search')#measure methodmeasure <- msr('surv.harrellC')#termination methodterminator <- trm('stagnation')#search_space definition(for num_nodes)search_space <- ps(num_nodes = p_fct(list(c(32,64,128,256)), trafo = function(x) c(sample(x,1), sample(x,1))))#To check search_spacegenerate_design_random(search_space,10)$transpose()
当我运行带有 transpose 的最后一行代码时,它展示了一个包含配对类别的 num_nodes 列表,如下所示:
[[1]]$num_nodes[1] 64 128[[2]]$num_nodes[1] 32 256...
然后我编写了以下代码:
#defining autotunerat <- AutoTuner$new(dh.learner, resampling, measure, terminator, tuner, search_space)#outer cross validationresampling_outer <- rsmp('cv', folds = 3)# nested resamplingnest_rsm <- resample(task.mlr, at, resampling_outer)
但在嵌套重采样的结果中,不是节点对,而是显示 num_nodes 为 c(32,64,128,256)
,类似这样:
num_nodes c(32,64,128,256) num_nodes c(32,64,128,256) ...
如何将具有 2 级的 ‘Param_Uty’(例如 32,64
)进行转换?
坦白说,我已经对此话题进行了大量搜索,但最终没有找到合适的答案,所以我非常感谢你的帮助。
回答:
你好,感谢你使用 mlr3proba。我实际上刚刚完成了一篇教程,恰好回答了这个问题!它涵盖了在 mlr3proba 中训练、调整和评估神经网络。对于你的具体问题,教程的相关部分如下:
library(paradox)search_space = ps( nodes = p_int(lower = 1, upper = 32), k = p_int(lower = 1, upper = 4))search_space$trafo = function(x, param_set) { x$num_nodes = rep(x$nodes, x$k) x$nodes = x$k = NULL return(x)}
在这里,我调整了两个新的超参数,一个代表每层的节点数,另一个是层数,然后我创建了一个转换,将它们组合成所需的超参数,num_nodes
。
你应该能够将此应用到你的例子中。