我正在寻找关于无监督学习在时间数据上最新方法的概述,这些方法
-
在时间数据中发现时间模式(任意长度)
-
并且是无监督的(没有标签)。
换句话说,给定一系列(可能高维的)数据流/序列,如何找到那些最能捕捉数据结构的常见子序列。
-
欢迎提供任何关于近期发展或论文的指引(希望能超越隐马尔可夫模型)!
-
这个问题是否在某个更具体的应用领域中已被很好地理解,比如
- 动作捕捉
- 语音处理
- 自然语言处理
- 游戏动作序列
- 股票市场预测?
- 此外,这些方法中是否有一些足够通用,能够处理
- 高噪声数据
- 层次结构
- 时间轴上的不规则间隔
(我不对检测已知模式、分类或分割序列感兴趣。)
回答:
最近对非参数隐马尔可夫模型、扩展到无限状态空间以及因子模型的重视有所增加,这些模型通过一组因子而不是单一的混合成分来解释观察结果。
以下是一些值得开始阅读的有趣论文(只需谷歌论文名称即可):
- “Beam Sampling for the Infinite Hidden Markov Model”
- “The Infinite Factorial Hidden Markov Model”
- “Bayesian Nonparametric Inference of Switching Dynamic Linear Models”
- “Sharing features among dynamical systems with beta processes”
这些论文的实验部分讨论了在文本建模、说话人分割和动作捕捉等方面的应用。