许多现实世界的数据集以多种视图的形式呈现。例如,一个人可以通过面部、指纹、签名和虹膜来识别,或者一张图片可以通过其颜色和纹理特征来表示。多视图基本上是从多个来源获取的信息。在机器学习/数据聚类/计算机视觉的背景下,哪些最相关的应用涉及这种方法?
回答:
在计算机视觉的背景下,多视图指的是从不同视图/角度/位置拍摄的同一对象的图像。这种策略有多种应用。从多视图进行3D重建是最受欢迎的例子之一。
您提到的多视图类型基本上是数据增强,用于解决单一问题。正如您所提到的,从不同类型的数据源识别一个人是数据增强的一种应用。还有其他多个应用。例如,使用来自RGB摄像头的数据 + 来自Kinect的3D数据 + 音频来识别一个人的情绪状态是另一个例子。
在机器学习的背景下,数据增强无处不在。结合图像或音频的不同特征进行分类就是数据增强。