非图像数据增强

我在寻找关于数据增强的算法和/或教程，但所有的资料都属于图像增强，这种方法能否应用于其他类型的数据集？我正在研究帕金森数据集（https://archive.ics.uci.edu/ml/datasets/parkinsons），我想用Python创建一个数据增强的示例，这是否可行？还是我应该使用像MNIST/FMNIST这样的数据集？

回答：

如果你能访问到实际的语音录音，你可以应用一些语音识别中使用的增强技术，然后重新提取基本频率等特征。然而，由于你直接处理的是特征，增强就变得更加棘手。可以通过在现有样本之间进行插值或添加噪声来生成合成样本，但由于特征之间高度相关，你需要一种智能的方法来做到这一点（请参阅这篇论文了解简单的方法，以及这篇论文了解更高级的技术）。如果你有类别不平衡的问题，可以尝试简单地过采样或欠采样。

学技术

非图像数据增强

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复