手势识别功能

我想创建一个应用程序,能够学习识别用户绘制的点序列,例如手写识别。如果数据点由多个(x,y)对组成(如对应于手势实例的像素),那么关于该实例应该计算哪些最佳特征,以便进行多类分类(例如SVM、NN等)?特别是在提供的训练样本有限的情况下。


回答:

如果我是你,我会找出对应于角点、端点和交叉点的那些数据点,将它们用作特征,并丢弃中间点。你还可以包括这些兴趣点的角度或其他描述符作为特征。

为了检测兴趣点,你可以使用Harris检测器,然后可以使用该点的梯度值作为简单的描述符。或者,你可以选择更复杂的方法,如SIFT

你可以使用下采样图像中每个像素的描述符,然后用SVM进行分类。这样做的缺点是特征向量中会有大量不重要的数据点。

另一种方法是不将其视为分类问题,而是作为模板匹配问题(在中相当常见)。在这种情况下,手势可以被指定为任意数量的兴趣点,完全省略非兴趣数据。一个实例的点中有某个阈值百分比必须与模板匹配才能进行积极识别。例如,当将’R’的一个实例的角点与’X’的模板匹配时,右下角的点应该匹配,因为它们是相同位置和方向的端点,但其他点差异太大,得分相当低,因此’R=X’的识别将被拒绝。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注