我需要一些用于机器学习目的的人工数据,具体包括“双螺旋”、“簇内簇”、“半核”、“新月-满月”和“异常值”。
在MATLAB中有没有相关的指南/软件包/源代码?
回答:
因为我认为拥有这些类型的数据集会很有用,而且这也将是一个有趣的练习,所以我编写了一些函数来生成与你图片中显示的非常相似的随机数据集。这些函数有很多选项可以控制实例的数量、噪声的量等。每个函数的输出是一个Nx3的矩阵,每一行包含一个实例的X,Y坐标和类别。
输出看起来是这样的:
我用6个脚本完成了这个工作,每个脚本大约30-40行。我已经将这些脚本上传到了Matlab文件交换平台,但尚未通过审核。目前,你可以从这里获取这些文件。这个初版几乎没有注释,但我希望代码本身是自解释的。还有一个演示脚本(datasetsdemo.m
),它将运行所有脚本并生成上图所示的图像。