在拟合LogisticRegression时发现输入变量的样本数量不一致

我正在使用以下代码创建LogisticRegression分类器:

regressor = LogisticRegression()regressor.fit(x_train, y_train)

x_trainy_train的形状都是

<class 'tuple'>: (32383,)

x_train包含的数值范围大约在[0..1]之间,而y_train只包含01

不幸的是,fit函数运行失败并显示错误

ValueError: Found input variables with inconsistent numbers of samples: [1, 32383]

为参数添加转置操作也无济于事。


回答:

继续我在评论中提出的解决方案:问题出在x_train的形状上。因此,我们需要重新塑形它:

根据文档说明:

X : {array-like, sparse matrix}, shape (n_samples, n_features)

y : array-like, shape (n_samples,)

示例使用scikit-learnnumpy

from sklearn.linear_model import LogisticRegressionimport numpy as np# 创建元组数据x_train = tuple(range(32383))x_train = np.asarray(x_train)# 对y_train进行同样的处理y_train=tuple(range(32383))y_train = np.asarray(y_train)# 将元组转换为nparray并重新塑形x_trainx_train = x_train.reshape(32383,1)# 检查形状是否为(32383,)y_train.shape# 创建模型lg = LogisticRegression()# 拟合模型lg.fit(x_train, y_train)

这样应该可以正常工作。希望对你有帮助

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注