C或Python中的声音识别和分类库

…

大家好！

我是一名学生，正在尝试制作一个关于声音识别的DIY设备。与语音识别相比，我不需要太精确和复杂的识别，我只想采用并使用一些简单的识别库来支持我的小应用。

换句话说，我想要的是“宽范围”的声音识别。例如，如果有“Boom! Boom!”的声音，我不需要识别出“哦，那是雪佛兰Corvette Z06的引擎声。好机器，对吧？”（X），而是识别为“汽车。朝我开来。声音大且吵。”（O）这就足够了。

或者，如果有“Ka-boom！”“Bang！”的声音，我不需要识别为“北桥上在放烟花。这个冬天？可能有些傻瓜在外面。”（X），而是“爆炸声。我绝对不会去那里。奇怪。”（O）这就足够了……等等。也就是说，我想使用匿名库来“分类”声音，并将其作为我的应用提供的指导信息的有用数据。

有没有什么有用的信息，或者可以推荐的库供我参考？我期待着你们的宝贵建议。谢谢。

此致，

J. Park

回答：

如果你对C++库（不是真正的C）持开放态度：

但你需要自己开发识别功能，这是通过使用标记为它们所产生噪音的样本库来完成的。这是一个长期项目，你是否熟悉信号处理，如傅里叶变换、DTW等？这些是标准的处理过程。

学技术