T-test for multiple classes (>2)

我读到了以下这句话:

与样本数量相比,功能性MRI数据是高维度的(通常是1000个样本的50000个体素)。在这种情况下,机器学习算法的表现可能不佳。然而,一个简单的统计测试可以帮助减少体素的数量。

学生t检验(scipy.stats.ttest_ind)执行一个简单的统计测试,用于判断两个分布是否在统计上有显著差异。它可以用来比较两种不同条件下的体素时间序列(在我们的例子中是展示房屋或人脸时的体素时间序列)。如果在两种条件下的时间序列分布相似,那么该体素在区分条件方面就不太重要。

这个测试返回的p值表示两个时间序列来自同一分布的概率。p值越低,体素的区分能力就越强。

来源:http://nilearn.github.io/building_blocks/manipulating_mr_images.html

这种t检验是否也可以应用于4个类别(条件)?如果可以,如何应用?

是否有可用的Matlab实现?


回答:

你需要对每个体素执行方差分析(ANOVA)测试。

从上述链接的维基百科页面中:

在其最简单的形式中,ANOVA提供了一个统计测试,用于判断几个组的平均值是否相等,因此它将t检验推广到了两个以上组的情况

问题要求你识别出那些状态随条件显著变化的体素,这正是ANOVA能够为你做到的。

这可以在MATLAB中使用anova1来实现,(文档)。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注