### 理解FastICA实现

我正在尝试为图像的盲信号分离实现FastICA(独立成分分析),但首先我想看看GitHub上一些能产生良好结果的例子。我试图比较维基百科上FastICA算法步骤中的主循环,但我很难看出它们实际上是如何相同的。

它们看起来非常相似,但有一些我无法理解的差异。看起来这个实现类似于(或与)维基上的“多成分提取”版本。

请有人帮我理解与非线性函数及其一阶和二阶导数相关的四行左右的代码,以及更新权重向量的第一行代码。任何帮助都将不胜感激!

以下是实现代码,我已经更改了变量以更接近维基百科的描述:

% X 是尺寸为 (NxM, 3x50K) 的混合图像数据矩阵(每行对应一个混合图像)
C=3; % 要分离的成分数量
W=zeros(numofIC,VariableNum); % 权重矩阵
for p=1:C
    % 初始化长度为 N 的随机权重向量
    wp = rand(C,1);
    wp = wp / norm(wp);
    % 执行如下操作:
    i = 1;
    maxIterations = 100;
    while i <= maxIterations+1
        % 直到达到最大迭代次数
        if i == maxIterations
            fprintf('未收敛: ', p,maxIterations);
            break;
        end
        wp_old = wp;
        % 这是算法的主要部分,我对特定实现感到困惑
        u = 1;
        t = X'*b;
        g = t.^3;
        dg = 3*t.^2;
        wp = ((1-u)*t'*g*wp+u*X*g)/M-mean(dg)*wp;
        % 第二和第三个 wp 更新步骤对我来说有意义
        wp = wp-W*W'*wp;
        wp = wp / norm(wp);
        % 或者直到 wp 收敛
        if abs(abs(b'*bOld)-1)<1e-10
            W(:,p)=b;
            break;
        end
        i=i+1;
    end
end

供快速参考的维基算法如下:

enter image description here


回答:

首先,我不明白为什么代码中保留了始终为零的项:

wp = ((1-u)*t'*g*wp+u*X*g)/M-mean(dg)*wp;

上述可以简化为:

wp = X*g/M-mean(dg)*wp;

并且移除 u,因为它始终为1。

其次,我认为以下这行代码是错误的:

t = X'*b;

正确的表达式应该是:

t = X'*wp;

现在我们来逐一分析这里的每个变量。让我们参考以下迭代方程:

w = E{Xg(wTX)T} – E{g‘(wTX)}w

  • X 是您的输入数据,即迭代方程中的 X

  • wp 是权重向量,即迭代方程中的 w。其初始值是随机的。

  • g 是非二次非线性函数的一阶导数,即迭代方程中的 g(wTX)。

  • dgg 的一阶导数,即迭代方程中的 g‘(wTX)。

  • M 虽然在您提供的代码中没有显示其定义,但我认为它应该是 X 的大小。


了解所有变量的含义后,我们现在可以尝试理解代码。

    t = X'*b; 

上述行计算 wTX

    g = t.^3; 

上述行计算 g(wTX) = (wTX)3。请注意,只要 f(u) 是非线性和非二次的,g(u) 可以是任何方程,其中 g(u) = df(u)/du

    dg = 3*t.^2; 

上述行计算 g 的导数。

    wp = X*g/M-mean(dg)*wp;

Xg 显然计算 Xg(wTX)。Xg/M 计算 Xg 的平均值,相当于 E{Xg(wTX)T}。

mean(dg)E{g‘(wTX)} 并乘以 wp 或方程中的 w

现在您拥有了牛顿-拉夫森方法所需的一切。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注