向浮点数数据集添加高斯噪声并保存它(Python)

我正在处理一个分类问题,需要向我的数据集添加不同级别的高斯噪声,并进行分类实验,直到我的机器学习算法无法对数据集进行分类。不幸的是,我不知道该怎么做。关于如何添加高斯噪声,您有什么建议或编程技巧吗?


回答:

您可以按照以下步骤操作:

  1. 将数据加载到pandas数据框中 clean_signal = pd.read_csv("data_file_name")
  2. 使用numpy生成与数据集相同维度的高斯噪声。
  3. signal = clean_signal + noise 将高斯噪声添加到干净信号中

这里是一个可复现的示例:

import pandas as pd# 创建一个维度为(2,2)的示例数据集# 在你的案例中,你需要用# clean_signal = pd.read_csv("your_data.csv") 替换它   clean_signal = pd.DataFrame([[1,2],[3,4]], columns=list('AB'), dtype=float) print(clean_signal)"""print output:     A    B0  1.0  2.01  3.0  4.0"""import numpy as np mu, sigma = 0, 0.1 # 创建与数据集相同维度(2,2)的噪声 noise = np.random.normal(mu, sigma, [2,2]) print(noise)"""print output: array([[-0.11114313,  0.25927152],       [ 0.06701506, -0.09364186]])"""signal = clean_signal + noiseprint(signal)"""print output:           A         B0  0.888857  2.2592721  3.067015  3.906358""" 

不带注释和打印语句的整体代码:


将文件保存回csv格式

signal.to_csv("output_filename.csv", index=False)

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注