将逻辑回归应用于简单数据集

我尝试将逻辑回归或其他机器学习算法应用于这个简单的数据集,但结果很失败,遇到了很多错误。我正在尝试

 dim(data) [1] 11580    12 head(data) ReturnJan   ReturnFeb   ReturnMar   ReturnApr    ReturnMay  ReturnJune  1  0.08067797  0.06625000  0.03294118  0.18309859  0.130333952 -0.01764234  2 -0.01067989  0.10211539  0.14549595 -0.08442804 -0.327300392 -0.35926605  3  0.04774193  0.03598972  0.03970223 -0.16235294 -0.147426982  0.04858934  4 -0.07404022 -0.04816956  0.01821862 -0.02467917 -0.006036217 -0.02530364  5 -0.03104575 -0.21267723  0.09147609  0.18933823 -0.153846154 -0.10611511  6  0.57980016  0.33225225 -0.40546095 -0.06000000  0.060732113 -0.21536106

而我试图预测的第12列看起来像这样

      PositiveDec      0      0      0      1      1      1

这是我的尝试

new.data <- data[,-12] #移除标签列index <- sample(1:nrow(new.data), size = 0.8*nrow(new.data))#分割数据train.data <- new.data[index,]test.data <- new.data[-index,]fit.glm <- glm(data[,12]~.,data = data, family = "binomial")

回答:

你已经接近成功了,但有几个语法错误,并且正如评论中指出的,你需要保留结果变量。这应该可以工作:

index <- sample(1:nrow(data), size = 0.8 * nrow(data))train.data <- data[index, ]fit.glm <- glm(PositiveDec ~ ., data = train.data, family = "binomial")

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注