T-test for multiple classes (>2)

我读到了以下这句话:

与样本数量相比,功能性MRI数据是高维度的(通常是1000个样本的50000个体素)。在这种情况下,机器学习算法的表现可能不佳。然而,一个简单的统计测试可以帮助减少体素的数量。

学生t检验(scipy.stats.ttest_ind)执行一个简单的统计测试,用于判断两个分布是否在统计上有显著差异。它可以用来比较两种不同条件下的体素时间序列(在我们的例子中是展示房屋或人脸时的体素时间序列)。如果在两种条件下的时间序列分布相似,那么该体素在区分条件方面就不太重要。

这个测试返回的p值表示两个时间序列来自同一分布的概率。p值越低,体素的区分能力就越强。

来源:http://nilearn.github.io/building_blocks/manipulating_mr_images.html

这种t检验是否也可以应用于4个类别(条件)?如果可以,如何应用?

是否有可用的Matlab实现?


回答:

你需要对每个体素执行方差分析(ANOVA)测试。

从上述链接的维基百科页面中:

在其最简单的形式中,ANOVA提供了一个统计测试,用于判断几个组的平均值是否相等,因此它将t检验推广到了两个以上组的情况

问题要求你识别出那些状态随条件显著变化的体素,这正是ANOVA能够为你做到的。

这可以在MATLAB中使用anova1来实现,(文档)。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注