p value generated by scipy.stats.chi2_contingency for independence testing

用于测试两个特征是否独立的假设检验,H0:A和B是独立的;H1:A和B是相关的

如果p值小于0.05,则A和B是相关的

在尝试以下代码时,很明显这两个数组是相关的(它们是相同的数组)

obs = np.array([[10, 10, 10], [10, 10, 10]])scipy.stats.chi2_contingency(obs)

我得到以下结果:

(0.0, 1.0, 2, array([[10., 10., 10.],        [10., 10., 10.]]))

即p值为1.0,大于0.05,因此我们接受原假设,即这两个数组是相互独立的。

我是否有错误的假设,或者它是生成1-p值?


回答:

您的计算是正确的。这仅意味着您拥有的变量是独立的,没有关联或相互联系。事件的独立性意味着它不会影响或影响另一个事件的发生。

在您的例子中,所有概率值都是相同的,因此在概率上,事件A的发生不依赖于事件B。

  P(A|B) = P(A)  或 P(B|A) = P(B)

这表示在给定事件B的情况下,事件A的概率与A的概率相同,因为A和B是独立的。因此,P(A)、P(B)、P(A|B)和P(B|A)是相同的,因为根据卡方统计,A和B是独立的。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注