假设我想生成4组点集。每一组点都在给定的x-y坐标范围内。每一组内的点都是随机生成的点。
这些点集将作为我的K-Means聚类问题的输入。我该如何使用Python来实现呢?
回答:
这可能会给你一些思路:
from random import randomimport mathdef rand_cluster(n,c,r): """返回以c为中心,半径为r的圆盘内的n个随机点""" x,y = c points = [] for i in range(n): theta = 2*math.pi*random() s = r*random() points.append((x+s*math.cos(theta), y+s*math.sin(theta))) return points
此函数可以以多种方式使用,例如:
def rand_clusters(k,n,r, a,b,c,d): """返回k个随机圆盘内的n个点集,圆盘半径为r,圆心在[a,b]x[c,d]范围内随机选择""" clusters = [] for _ in range(k): x = a + (b-a)*random() y = c + (d-c)*random() clusters.extend(rand_cluster(n,(x,y),r)) return clusters
典型的调用方式如下:
clusters = rand_clusters(4,50,0.3,0,1,0,1)
这将生成4个大小为50,半径为0.3
的点集,圆心在单位正方形内随机选择。一次典型运行的点如下图所示: