我在尝试使用MLPClassifier。我做得对吗?
以下是我的代码:
之前我写的是:
x =[[181,80,44],[177,70,43],[160,60,30],[154,54,37], [166,65,40],[190,90,47],[175,64,39],[177,60,43], [171,57,44],[191,85,42],[165,55,40]]
但我现在尝试简化我的代码如下:
x =[(np.random.randn(36).reshape(12,3)).tolist()]y= ['male','female','female','female','female','male', 'male','female','male','female','male','female']clf = MLPClassifier()clf = clf.fit(x,y)prediction = clf.predict([[0,0,0]])print(prediction)
回答:
您遇到的错误是由以下这行代码引起的:
x =[(np.random.randn(36).reshape(12,3)).tolist()]
在这里,您创建了一个有12行和3列的数组,这对于分类器的特征使用是完全合适的,然后您使用tolist()
将其转换成12个包含3个项目的列表集合,这是不必要的。接着您在其周围使用列表解析[]
,这创建了一个包含12个每个包含3个项目的列表的列表,而实际上您只需要像使用reshape()
初始创建的12×3数组对象。
改用以下这行代码,错误就会消失:
x = np.random.randn(36).reshape(12,3)
我还要补充一点,您使用了一个非常小的训练集,并且两个类别都是从相同的分布中随机生成的。这将不会允许良好的分离,因为它们基本上是相同的数据随机分割成两个任意分类,即male
和female
。
您应该随机抽样两个不同的分布(不同的均值和标准差),并使用更大的样本大小来进行训练和测试,如果您要创建自己的数据集。我建议尝试一些sklearn数据集或查找一些教程,以更好地理解我的意思。