我似乎有一个非常常见的任务,但我缺少一些关键词来帮助我找到相关信息。所以我在这里陈述我的任务。
有若干人。每个人都有一组已知的变量。一对人P1和P2可以处于以下关系之一(这些是类别):
- 父子关系
- 兄弟姐妹
- 伴侣(重要的另一半)
- 其他(一些间接亲属或非家庭成员)
通过选择具有已知关系的对(Pi, Pk)的一些变量,我可以训练一个朴素贝叶斯分类器来预测类别。这很好。
现在,我有一组人P1, P2, … Pm,我需要构建最可能的图形来表示家族树。我可以成对使用我的贝叶斯分类器,但在这种情况下,我不会使用存储在图形中/多个节点组合中的大量信息。
例如,给定节点P1, P2, P3和P4。我的贝叶斯分类器认为P2是P1的父母的概率为0.9,P4是P3的父母的概率为0.9。至于P1和P3之间的关系,它返回兄弟姐妹的概率为0.31,伴侣的概率为0.34,因此结果相当不可靠。现在,如果P2和P4之间的关系分类为“伴侣”,概率为0.7,我可以更确定P1和P3实际上是兄弟姐妹。另一方面,如果P2和P4是“其他”,概率为0.8,我可以更安全地得出结论,P1和P3是伴侣。
我可以手动编写这种逻辑,但我认为有更多情况和逻辑依赖性,特别是如果我们想要为大约10或20个人构建关系图。因此,我想使用某种分类器或分类器系统。
但是,这个分类器系统的输出将不是二进制或标量值,而是一个完整的图形。我可以使用什么,或者我应该从哪里开始寻找?
谢谢!
回答:
你想要进行某种结构学习。就像图形比比特复杂得多,结构学习也比分类复杂得多。
你可能想要找到一个最大后验概率(MAP)家族树,根据你对各个关系的概率知识。MAP是基于你所有知识的单一最可能的分配。确定概率相关项之间关系的一般问题被称为概率推断,有时简称为推断。
我不知道你是否能访问最近完成的概率图模型课程的材料,但那值得研究。