我是H2o flow的新用户。我不太会编程,所以我喜欢这种点选式的界面。我在想,建立模型并用它对数据集进行评分后,是否有办法生成输出,告诉我每条记录的评分原因是什么。
例如,我使用flow中的autoML功能创建了一个模型,用于预测医院再入院的风险。
这个模型实际上运作得很好,但是当我使用它时,我会将高风险患者发送给临床人员,他们想知道“为什么这个人被评为高风险”。
有没有办法显示模型中哪些变量导致了每个人的预测结果,并将这些输出导出到数据库中,以便在报告工具中使用?
谢谢!
回答:
你的问题涉及到机器学习的可解释性技术。在H2O-3中,有两种可用的技术:变量重要性图(它告诉你哪些特征对模型决策的影响最大)和部分依赖图,后者让你了解单个特征(也称为列或变量)如何影响模型的平均预测。
关于可用的机器学习可解释性技术概述,我建议你看一下H2O.ai的MLI小册子(不过请注意,这些技术大部分只在另一个产品中提供——所以如果你想使用它们,你需要自己编写这些技术的代码)。