我在Python中构建了一个决策树,但我在解释它时遇到了困难。树的结构如下图所示。
这是一个流失模型的结果。我想知道如何解释以下内容:
1. 家中儿童数量 <=3.5 (整数) 2. 婚姻状况_已婚 <= 0.5 (已婚为二进制变量。我预期是婚姻状况_已婚=0 或 =1) 3. 销售原因_价格<=0.5 (二进制变量。我预期是销售原因_价格=0 或 =1) 4. 客户留存月数<= 0.5 (整数)
回答:
树中分支决策偏好使用<=
关系(而不是等于,即使后者对人类读者来说可能更直观),这是有内部原因的,但这种表示细节不应该影响到解释,这正是你在这里询问的内容。
所以,实际来说:
儿童数量 <= 3.5
意味着少于四个儿童
(假设变量为整数)婚姻状况_已婚 <= 0.5
对于二进制变量意味着婚姻状况_已婚==0
(即未婚
)销售原因_价格<=0.5
对于二进制变量意味着销售原因_价格==0
客户留存月数<= 0.5
意味着客户留存月数==0
(假设变量为整数)