我正在尝试为图像的盲信号分离实现FastICA(独立成分分析),但首先我想看看GitHub上一些能产生良好结果的例子。我试图比较维基百科上FastICA算法步骤中的主循环,但我很难看出它们实际上是如何相同的。
它们看起来非常相似,但有一些我无法理解的差异。看起来这个实现类似于(或与)维基上的“多成分提取”版本。
请有人帮我理解与非线性函数及其一阶和二阶导数相关的四行左右的代码,以及更新权重向量的第一行代码。任何帮助都将不胜感激!
以下是实现代码,我已经更改了变量以更接近维基百科的描述:
% X 是尺寸为 (NxM, 3x50K) 的混合图像数据矩阵(每行对应一个混合图像)
C=3; % 要分离的成分数量
W=zeros(numofIC,VariableNum); % 权重矩阵
for p=1:C
% 初始化长度为 N 的随机权重向量
wp = rand(C,1);
wp = wp / norm(wp);
% 执行如下操作:
i = 1;
maxIterations = 100;
while i <= maxIterations+1
% 直到达到最大迭代次数
if i == maxIterations
fprintf('未收敛: ', p,maxIterations);
break;
end
wp_old = wp;
% 这是算法的主要部分,我对特定实现感到困惑
u = 1;
t = X'*b;
g = t.^3;
dg = 3*t.^2;
wp = ((1-u)*t'*g*wp+u*X*g)/M-mean(dg)*wp;
% 第二和第三个 wp 更新步骤对我来说有意义
wp = wp-W*W'*wp;
wp = wp / norm(wp);
% 或者直到 wp 收敛
if abs(abs(b'*bOld)-1)<1e-10
W(:,p)=b;
break;
end
i=i+1;
end
end
供快速参考的维基算法如下:
回答:
首先,我不明白为什么代码中保留了始终为零的项:
wp = ((1-u)*t'*g*wp+u*X*g)/M-mean(dg)*wp;
上述可以简化为:
wp = X*g/M-mean(dg)*wp;
并且移除 u
,因为它始终为1。
其次,我认为以下这行代码是错误的:
t = X'*b;
正确的表达式应该是:
t = X'*wp;
现在我们来逐一分析这里的每个变量。让我们参考以下迭代方程:
w = E{Xg(wTX)T} – E{g‘(wTX)}w
-
X
是您的输入数据,即迭代方程中的 X。 -
wp
是权重向量,即迭代方程中的 w。其初始值是随机的。 -
g
是非二次非线性函数的一阶导数,即迭代方程中的 g(wTX)。 -
dg
是g
的一阶导数,即迭代方程中的 g‘(wTX)。 -
M
虽然在您提供的代码中没有显示其定义,但我认为它应该是X
的大小。
了解所有变量的含义后,我们现在可以尝试理解代码。
t = X'*b;
上述行计算 wTX。
g = t.^3;
上述行计算 g(wTX) = (wTX)3。请注意,只要 f(u) 是非线性和非二次的,g(u) 可以是任何方程,其中 g(u) = df(u)/du。
dg = 3*t.^2;
上述行计算 g
的导数。
wp = X*g/M-mean(dg)*wp;
Xg
显然计算 Xg(wTX)。Xg/M
计算 Xg
的平均值,相当于 E{Xg(wTX)T}。
mean(dg)
是 E{g‘(wTX)} 并乘以 wp
或方程中的 w。
现在您拥有了牛顿-拉夫森方法所需的一切。