类似于Netflix竞赛,假设我们有一个包含缺失评分的电影数据集。我该如何修改受限玻尔兹曼机(RBM)来推断这些缺失值?在相关论文中,一种直接的方法是对缺失的可见特征进行随机填补。然而,我对重构的准确性持怀疑态度,因为它可能依赖于这些缺失可见节点的初始值。
你有什么建议吗?
谢谢
回答:
https://www.youtube.com/watch?v=laVC6WFIXjg,这个视频可能会有所帮助。
我认为在填补随机值后进行采样是一个好主意。Hinton在视频中对此进行了解释。你也可以尝试估计先验,或者进行多次采样,或者基于其他不同方法进行猜测,然后再进行重构。
在视频中,Hinton提到这种方法本身确实不够准确,但当与矩阵分解(或其他类似方法)结合使用时,可以非常强大。