虽为小禽,尚能解艺道之奥妙,汝等生而为人竟不及鸟类。
Cramér-Chernoff 方法:
Pr[X≥a]≤λ>0mine−λaE[eλx]
证明:根据 Markov Inequality,Pr[X≥a]=Pr[eλx≥eλa]≤e−λaE[eλa] 对任意λ>0 都成立。指数变化就是因为要求随机变量是非负的,就可以使用 Markov Inequality。
□
单位模引理:设u∈Rn 是独立重复采样自N(0,n1) 的向量,那么对于给定常数ε>0,我们有:
Pr[∣∥u∥2−1∣≥ε]≤2e−ε2n/8
证明:根据 Cramér-Chernoff 方法:
Pr[∥u∥2−1≥ε]≤λ>0mine−λεE[eλ(∥u∥2−1)]=λ>0mine−λ(ε+1)E[eλ∥u∥2]=λ>0mine−λ(ε+1)E[eλ∑i=1nui2]=λ>0mine−λ(ε+1)E[i=1∏neλui2]
因为u 的每个分量都是独立选取,所以:
Pr[∥u∥2−1≥ε]≤λ>0mine−λ(ε+1)E[i=1∏neλui2]=λ>0mine−λ(ε+1)i=1∏nE[eλui2]
其中
E[eλui2]=∫−∞∞2πne−nui2/2eλui2dui=n−2λn
故
Pr[∥u∥2−1≥ε]≤λ>0mine−λ(ε+1)(n−2λn)n/2
当λ=2(1+ε)nε 时右侧取到最小值。此时有:
Pr[∥u∥2−1≥ε]≤en(log(1+ε)−ε)/2≤e−nε2/8
另一侧Pr[∥u∥2−1≤−ε] 也类似可以得到证明。
□
正交性引理:设u,v∈Rn 是独立重复采样自N(0,n1) 的两个向量,那么给定ε∈(0,1),我们有:
Pr[∣⟨u,v⟩∣≥ε]≤4e−ε2n/8
证明:若u,v∼N(0,n1),那么2u+v∼N(0,n1)。那么根据单位摸引理,有:
⎩⎪⎪⎪⎨⎪⎪⎪⎧Pr[∥∥∥∥2u+v∥∥∥∥2−1≥ε]≤e−nε2/8Pr[∥∥∥∥2u+v∥∥∥∥2−1≤−ε]≤e−nε2/8
而⟨u,v⟩≥ε⇔∥∥∥∥2u+v∥∥∥∥2−∥∥∥∥2u−v∥∥∥∥2≥2ε,故:
Pr[⟨u,v⟩≥ε]=Pr[∥∥∥∥∥2u+v∥∥∥∥∥2−1+1−∥∥∥∥∥2u−v∥∥∥∥∥2≥2ε]≤Pr[∥∥∥∥∥2u+v∥∥∥∥∥2−1≥ε∨1−∥∥∥∥∥2u−v∥∥∥∥∥2≥ε]≤Pr[∥∥∥∥∥2u+v∥∥∥∥∥2−1≥ε]+Pr[1−∥∥∥∥∥2u−v∥∥∥∥∥2≥ε]≤2e−nε2/8
其中,第一个小于等于号是因为:
∥∥∥∥∥2u+v∥∥∥∥∥2−1+1−∥∥∥∥∥2u−v∥∥∥∥∥2≥2ε⇒∥∥∥∥∥2u+v∥∥∥∥∥2−1≥ε∨1−∥∥∥∥∥2u−v∥∥∥∥∥2≥ε
□
Johnson-Lindenstrauss Lemma: 给定N 个向量v1,v2,...,vN∈Rm 和n>ε224logN,而随机矩阵A∈Rn×m 独立重复采样自N(0,n1)。那么对于给定常数ε∈(0,1),至少有NN−1 的概率,使得对于所有的i=j 都有:
(1−ε)∥vi−vj∥2≤∥Avi−Avj∥2≤(1+ε)∥vi−vj∥2
这个定理其实是说,不管原来向量是多少维数,只需要ε224logN 维度,我们就可以容纳下N 个向量,而且使得变换后的向量直接的距离和原来的距离只有1±ε 的误差。这个变换也很简单,就是随机采样一个n×m 的矩阵。
证明:对于单位一个单位向量u 的话,Au 就是每个分量都独立服从于N(0,n1) 的随机变量。那么令u=∥vi−vj∥vi−vj,那么∥vi−vj∣A(vi−vj) 就是一个每个分量都独立服从于N(0,n1) 的向量。利用单位根引理,有:
Pr[∣∣∣∣∣∣∥∥∥∥∥∥vi−vj∥A(vi−vj)∥∥∥∥∥2−1∣∣∣∣∣∣≥ε]≤2e−ε2n/8
故:
Pr[∃(i,j),∣∣∣∣∣∣∥∥∥∥∥∥vi−vj∥A(vi−vj)∥∥∥∥∥2−1∣∣∣∣∣∣≥ε]≤2(N2)e−ε2n/8
所以:
Pr[∀(i,j),∣∣∣∣∣∣∥∥∥∥∥∥vi−vj∥A(vi−vj)∥∥∥∥∥2−1∣∣∣∣∣∣≤ε]≥1−2(N2)e−ε2n/8
当n>ε224logN 时,右侧值为NN−1。
□