概念
目的:source separation
input:x⊂Rd,有n个x. $ x^{(i)}.\text{size} = (d,1) $
output:s⊂Rd,要求s不能是Gaussian分布的,否则无法求出s
function:f(x)=s, s.t. x(i)=As(i) or x=As
其中A叫做maxing matrix,W叫做unmixing matrix,W=A−1, s=Wx, sj(i)=ωjTx(i)
W=⎣⎢⎢⎢⎡−ω1T−−ω2T−...−ωdT−⎦⎥⎥⎥⎤
ICA算法
maximum likelihood estimation|MLE算法
假设source 是独立于彼此的,则
p(s)=j=1∏dps(sj)
背景知识点1:px(x)是x的density,ps是s的density,且x=W−1s,则px(x)=ps(Wx)∣W∣
根据知识点1,将x=As=W−1s带入
p(s)=j=1∏dps(ωjTx)⋅∣W∣
背景知识点2:cumulative distribution function (cdf) F的定义是为F(z0)=P(z≥z0)=∫−∞z0pz(z)dz,density pz(z)=F′(z)
背景知识点3:对于sigmoid函数而言,g′(s)=g(s)(1−g(s))
背景知识点4:∇W∣W∣=∣W∣(W−1)T
为了specify si的density,我们选取一个具体的cdf,这个cdf可以是除了Gaussian以外所有的cdf,为了计算方便(根据知识点3),我们选取了sigmoid 函数g(s)=1/(1+e−s),根据知识点2,带入后ps(s)=g′(s),得到了likelyhood
l(W;x)=i=1∑n(j=1∑dlogg′(ωjTx(i))+log∣W∣)
∣W∣指的是det(W)
迭代
为了maximum l(W;x),运用知识点3和4,对W进行迭代,迭代算法式子如下(固定i):
W:=W+α∇Wl(W;x)=W+α⎝⎜⎜⎜⎛⎣⎢⎢⎢⎡1−2g(ω1Tx(i))1−2g(ω2Tx(i))...1−2g(ωdTx(i))⎦⎥⎥⎥⎤x(i)T+(WT)−1⎠⎟⎟⎟⎞
收敛
直到该算法收敛,即W不再变化,则我们可以通过s(i)=Wx(i)来求出original sources
参考资料
https://www.emerald.com/insight/content/doi/10.1016/j.aci.2018.08.006/full/html
声明:此blog内容为上课笔记,仅为分享使用。部分图片和内容取材于课本、老师课件、网络。如果有侵权,请联系aursus.blog@gmail.com删除。