我的目标是创建一个部分依赖图(PDP),展示两个输入变量对我的h2o随机森林模型的响应的交互作用。以下是一个可复现的示例设置:
library(h2o)data(diabetes, package = 'lars')h2o.init()train_data <- as.h2o(cbind(diabetes$x, target=diabetes$y))X_names <- colnames(diabetes$x)y_name <- "target"rf <- h2o.randomForest(x=X_names, y=y_name, training_frame=train_data, ntrees=10, max_depth=5)h2o.partialPlot(rf, train_data, c("age", "bmi"))
上面的代码分别绘制了age
和bmi
的两个PDP,但它们并未展示当它们一起变化时如何影响响应的任何信息。
假设我想要在x轴绘制age
,在y轴绘制bmi
,在z轴绘制平均响应的三维图表。
h2o中是否有功能(或最佳实践指南)可以帮助构建这样的图表?我可以通过自己创建响应数据来解决这个问题,但这可能会有些繁琐。
参见相关内容:
https://stats.stackexchange.com/questions/197455/how-to-plot-3d-partial-dependence-in-gbm
回答:
这不是h2o.partialPlot
的功能。你可以在文档和源代码中验证这一点。
我认为你的选择包括
- 请求作为一个功能
- 使用你链接的方法,该方法在你将数据转换回常规的R类后,可以很好地处理你的
h2o
数据