吾生而有涯而学而无涯以有涯而逐无涯殆矣！

# 量子力学引论

# 线性代数基础

# 记号

# 线性算子与矩阵

定义在空间 V 到空间 W 上的线性算子为对任一输入是线性的函数 $A:V\rightarrow W$ 满足：

$A(\sum_ia_i|\psi\rang)=\sum_ia_i(A|\psi\rang)$

称 A 为线性算子。
线性算子常用矩阵来表示。考虑线性算子 $A:V\rightarrow W$

设 $|v_1\rang,...,|v_n\rang$ 是空间 $V$ 的一组基， $|w_1\rang,...,|w_m\rang$ 是空间 $W$ 的一组基，若：

$A|v_j\rang\equiv\sum_iA_{ij}|w_i\rang$

则 $A_{ij}$ 为 A 的一个矩阵表示。

上式的意义为，把 A 作用于 V 中的每个基向量（此时 A 是抽象的算子而非矩阵），一定会得到 W 中的一个向量。而这个向量可以用 W 的基表示。将每个 V 中的基向量对应的 W 中的坐标放在一起，就可以精确地描述这个算子实际上进行了怎样的运算。

# Pauli 阵

$I=\begin{pmatrix}1&0\\0&1\end{pmatrix},X=\begin{pmatrix}0&1\\1&0\end{pmatrix}\\ Y=\begin{pmatrix}0&-i\\i&0\end{pmatrix},Z=\begin{pmatrix}1&0\\0&-1\end{pmatrix}$

# 内积

内积定义为 $V\times V\rightarrow C$ 的函数，满足对任意 $|v\rang,|w\rang\in V$ ：
- $(|v\rang,\sum_i\lambda_i|w_i\rang)=\sum_i\lambda_i(|v\rang,|w_i\rang)$
- $(|v\rang,|w\rang)=(|w\rang,|v\rang)^*$
- $(|v\rang,|v\rang)\geq 0,(|v\rang,|v\rang)=0\quad iff|v\rang=0$
$(\sum_i\lambda_i|v_i\rang,|w\rang)=\sum_i\lambda_i^*(|v_i\rang,|w\rang)$
范束定义为|||v\rang||=\sqrt{\lang v|v\rang},\lang i|j\rang=\delta_
Schmidt 正交化

$|v_1\rang=|w_1\rang\\ |v_{k+1}\rang=\frac{|w_{k+1}\rang-\sum_{i=1}^k\lang v_i|w_{k+1}\rang|v_i\rang}{|||w_{k+1}\rang-\sum_{i=1}^k\lang v_i|w_{k+1}\rang|v_i\rang||}$

# 外积

对 $|v\rang\in V,|w\rang\in W,$ 外积 $|w\rang\lang v|$ 定义为 $V\rightarrow W$ 的算子，满足:

$(|w\rang\lang v|)|v'\rang=\lang v|v'\rang|w\rang$
令 $|v_i\rang$ 为空间 $V$ 的一组标准正交基，有:

$\forall |v\rang\in V,\sum_i(|v_i\rang\lang v_i|)|v\rang=\sum_i\lang v_i|v\rang|v_i\rang=|v\rang(|v\rang在|i\rang上的投影为\lang v_i|v\rang)$

所以， $\sum_i|i\rang\lang i|=I$
对任意一个 $V\rightarrow W$ 的算子 A，它都可以表示成外积关系。

$A=I_WAI_V=\sum_{i,j}|w_j\rang\lang w_j|A|v_i\rang\lang v_i|\\ =\sum_{i,j}\lang w_j|A|v_i\rang|w_j\rang\lang v_i|$

所以对于输入基 $|v_i\rang$ 和输出基 $|w_i\rang$ ，A 的矩阵表示中 $A_{ji}=\lang w_j|A|v_i\rang$
Cauchy-Schwarz 不等式

$|\lang v|w\rang|^2\leq\lang v|v\rang\lang w|w\rang$

# 特征值与特征向量

若矩阵 A 是酉相似与对角阵，则它是酉可对角化的。即：
$若A=U^{-1}diag\{\lambda_1,...,\lambda_n\}U,其中，U^\intercal U=U^\intercal U=I,则A=\sum_i\lambda_i|\lambda=i\rang\lang\lambda=i|$

# Hermite 算子与伴随

设 A 是空间 $V$ 上的线性算子，则存在且只存在一个空间 $V$ 上的算子 $A^\intercal$ 使得：

$\forall |v\rang,|w\rang\in V,(|v\rang,A|w\rang)=(A^\intercal|v\rang,|w\rang)$
$(AB)^\intercal = B^\intercal A^\intercal,(|v\rang)^\intercal=\lang v|\\ A^\intercal = (A^*)^T$
设 $W$ 是 d 维空间 $V$ 的 k 维子空间，且 $|v_1\rang,...,|v_k\rang$ 为 $W$ 的一组标准正交基，定义：

$P\equiv\sum_{i=1}^k|v_k\rang\lang v_k|$

则 P 是 Hermite 的，即 $P^\intercal = P$ 。我们称 P 为 “到空间 W 上的投影算子”，它的意义是，对于任意一个 V 中的向量 $|v\rang$ ， $P|v\rang=\sum_{i=1}^k\lang v_k|v\rang|v_k\rang$ ，其实就把 $|v\rang$ 分解到 W 的基上，从而去除和 W 正交的分量。（和数学中定义幂等算子为投影算子不等价！）

P 的正交补算子 $Q\equiv I-P$ 就是把向量投影到补空间上。显然 $(P+Q)|v\rang=|v\rang$
投影算子满足 $P^2=P$ ，但反之不成立！
矩阵 A 是正规的当且仅当 $A^\intercal A=AA^\intercal$ 。矩阵 A 可酉对角化（酉相似于对角阵，可对角化）当且仅当 A 是正规矩阵。（谱分解定理）
正规矩阵是 Hermite 的当且仅当它的特征值全为实数。
矩阵 A 是酉的当且仅当 $A^\intercal A=I$

酉矩阵保持内积 $(U|v\rang,U|w\rang)=(U|v\rang)^\intercal(U|w\rang)=\lang v|U^\intercal U|w\rang=\lang v|w\rang$

因此，酉算子有很好的性质：

若 $|v_i\rang$ 为一组标准正交基，则定义 $|w_i\rang\equiv U|v_i\rang$ 也为一组标准正交基，且 $U=\sum|w_i\rang\lang v_i|$

反之，若 $|w_i\rang,|v_i\rang$ 都为标准正交基，则 $\sum|w_i\rang\lang v_i|$ 是酉的。
酉矩阵所有特征值模均为一。即 $\lambda\equiv e^{i\theta}$ ，Pauli 矩阵都是 Hermite 和酉的。
正定和半正定算子，即考量 $\lang v|A|v\rang$ 是否恒大于（大于等于）零。

# 张量积

设 $|i\rang$ 为 $V$ 的一组标准正交基， $|j\rang$ 为 $W$ 的一组标准正交基，则 $|i\rang\otimes|j\rang$ 为空间 $V\otimes W$ (nm 维) 的一组标准正交基。
张量积满足：
- $z(|v\rang\otimes|w\rang)=z|v\rang\otimes z|w\rang$
- $(|v\rang+|w\rang)\otimes|u\rang=|v\rang\otimes|u\rang+|w\rang\otimes|u\rang$
- $|u\rang\otimes(|v\rang+|w\rang)=|u\rang\otimes|v\rang+|u\rang\otimes|w\rang$
由此，可以定义定义在 $V\otimes W$ 上的线性算子 $A\otimes B$ 满足：

$(A\otimes B)(|v\rang\otimes|w\rang)=A|v\rang\otimes B|w\rang$

(有点类似同构映射保持运算的意思。)
同样，可以定义 $V\otimes W$ 上的自然内积为：

$(|v_1\rang\otimes|w_1\rang,|v_2\rang\otimes|w_2\rang)=\lang v_1|v_2\rang\lang w_1|w_2\rang\\ (\sum_ia_i|v_i\rang\otimes|w_i\rang,\sum_jb_j|v_j'\rang\otimes |w_j'\rang)=\sum_{i,j}a_i^*b_j\lang v_i|v_j'\rang\lang w_i|w_j'\rang$
一个具体的张量积：Kronecker 积

$A_{m\times n}\otimes B_{p\times q}=\begin{pmatrix}A_{11}B&A_{12}B&...&A_{1n}B\\ ...&...&...&...\\A_{m1}B&A_{m2}&...&A_{mn}B\end{pmatrix}_{mp\times nq}$
张量积对一些运算是分配的：

$(A\otimes B)^*=A^*\otimes B^*,(A\otimes B)^T=A^T\otimes B^T,(A\otimes B)^\intercal = A^\intercal\otimes B^\intercal$
两个酉算子张量积是酉的，两个 Hermite 张量积是 Hermite 的，两个半正定算子的张量积是半正定的，两个投影算子的张量积是投影算子。

# 算子函数

算子函数定义在正规算子上。 $f(A)=f(\sum\lambda_i|i\rang\lang i|)=\sum f(\lambda_i)|i\rang\lang i|$
算子的迹定义为算子任意一个矩阵表示的对角线元素和。不难证明 $tr(AB)=tr(BA),tr(zA)=ztr(A)$ ，且矩阵的迹在酉相似下保持不变。故可定义为任意一个矩阵表示。
$tr(A|\psi\rang\lang\psi|)=\sum\lang i|A|\psi\rang\lang\psi|i\rang=\lang \psi|A|\psi\rang,|i\rang=(0,0,...,1(第i个),...,0)^T$

# 对易式与反对易式

对易式 $[A,B]\equiv AB-BA$ ，反对易式 $\{A,B\}=AB+BA$ ，若 $[A,B]=0$ ，则称 A,B 为对易的。
同时对角化定理：设 A,B 是 Hermite 算子，当且仅当存在一个标准正交基，使得 A 和 B 在这个基下同时是可酉对角化的，则 $[A,B]=0$ ，在这种情况下，称 A,B 可同时对角化。

$可以验证A=Q^{-1}D_1Q,B=Q^{-1}D_2Q,Q^\intercal Q=I\Rightarrow [A,B]=0，下面证明反过来的命题$

$记|a_j\rang为本征值a的本征空间V_a的一组标准正交基，有:\\ AB|a_j\rang=BA|a_j\rang=aB|a_j\rang\\ 令P_a为到V_a的投影算子，定义B_a\equiv P_aBP_a,显然B_a的本征空间是V_a 的子空间\\(P_a(BP_a|v\rang)=b|v\rang\Rightarrow |v\rang\in V_a)\\，且B_a是Hermite的\\ 于是B_a在V_a的标准正交基下可谱分解，记这些本征矢为|a_{b_j}\rang\\ 显然有P_a|a_{b_j}\rang=|a_{b_j}\rang,B|a_{b_j}\rang=P_aB|a_{b_j}\rang(B|a_{b_j}\rang是V_a中的元素)\\ 所以有B|a_{b_j}\rang=P_aBP_a|a_{b_j}\rang=b|a_{b_j}\rang\\ 所以在|a_{b_j}\rang下,A,B可同时对角化$
$AB=\frac{[A,B]+\{A,B\}}{2}$

# 极式分解和奇异值分解

极式分解：令 A 是空间 V 上的线性算子，则存在酉算子 U 和半正定算子 J,K 满足：

$A=UJ=KU,其中J\equiv\sqrt{A^\intercal A},K\equiv\sqrt{AA^\intercal}\\ 而且若A可逆，则U也唯一$

证明：

$J\equiv \sqrt{A^\intercal A}是一个半正定算子，则其也是Hermite的，可进行谱分解J=\sum_i\lambda_i| i\rang\lang i|\\ 定义|\psi_i\rang\equiv A|i\rang,有\lang\psi_i|\psi_i\rang=\lambda_i^2\\ 考虑\lambda_i\neq 0的本征矢，定义|e_i\rang\equiv|\psi_i\rang/\lambda_i，故|e_i\rang是单位化的\\ 且对于i\neq j,\lang e_i|e_j\rang=\frac{\lang i|A^\intercal A|j\rang}{\lambda_i\lambda_j}=\frac{\lang i|J^2|j\rang}{\lambda_i\lambda_j}=\frac{\lambda_i^*\lambda_j\lang i|j\rang}{\lambda_i\lambda_j}=0\\ 所以|e_i\rang是标准正交的\\ 定义酉算子U\equiv \sum_i|e_i\rang\lang i|,下面证明算子U=算子A\\ \forall |i\rang,\lambda_i\neq 0时，UJ|i\rang=\lambda_i|e_i\rang=A|i\rang\\ \lambda_i=0时，UJ|i\rang=0=A|i\rang\\ 所以A=UJ$

$下面证明J是唯一的.\\ 因为A=UJ,所以A^\intercal = J^\intercal U^\intercal=JU^\intercal\\ 乘在一起，A^\intercal A=J^2,即J是固定唯一的\\ 关于右极式分解，A=UJU^\intercal U=(UJU^\intercal)U=KU,K也是半正定的。$
奇异值分解：令 A 是一方阵，则必存在酉矩阵 U,V 和一个非负对角阵 D，使得：

$A=UDV$

简单证明：

$A=SJ(极值分解)\\ J=TDT^\intercal(J=\sqrt{A^\intercal A}酉相似于对角阵，T为酉矩阵)\\ 所以A=(ST)D(T^\intercal)=UDV$

其中 D 的对角元素称为 A 的奇异值。

# 量子力学假设

# 假设一：状态空间

假设 1：任意一个孤立物理系统都有一个称为系统状态空间的复内积向量空间（即 Hilbert 空间）与之联系，系统完全由状态向量所描述，这个向量是系统状态空间的一个单位向量。
例：一个量子比特的状态空间（二维）。状态空间中的任意状态向量可写作

$|\psi\rang=a|0\rang+b|1\rang,a,b\in C$

而 $|a|^2+|b|^2=1$ 常称为状态向量的归一化条件。
任意线性组合 $\sum_i\alpha_i|\psi_i\rang$ 理解为状态 $|\psi_i\rang$ 具有幅度 $\alpha_i$ 的一个叠加。

# 假设二：演化

假设 2：一个封闭量子系统的演化可以由一个酉变化来刻画。即系统在时刻 $t_1$ 的状态 $|\psi_1\rang$ 和在 $t_2$ 的状态 $|\psi_2\rang$ 可以通过一个仅依赖时间 $t_1,t_2$ 的酉算子来联系：

$|\psi_2\rang=U(t_1,t_2)|\psi_1\rang,where\quad U^\intercal U=UU^\intercal =I$
Pauli 矩阵中 X 被称为比特翻转（bit flip）矩阵，Z 被称为相位翻转（phase flip）矩阵。
假设 2‘：封闭量子系统的演化由薛定谔方程描述：

$i\hbar\frac{d|\psi\rang}{dt}=H|\psi\rang$

其中， $H$ 称为封闭系统 Hamilton 量固定 Hermite 算子，常用实验得出。

而因为 H 是 Hermite 的，故有谱分解：

$H=\sum_E E|E\rang\lang E|$

其中，状态 $|E\rang$ 习惯上称作能量本征态（energy eigenstate）或定态（stationary state），而 $E$ 是 $|E\rang$ 的能量。最小的 E 称为系统的基态能量（ground state energy），相应的能量本征态（或本征空间）称为基态（ground state）。

* 状态 $|E\rang$ 常被称作定态是因为它们随时间的变化只是一个数值因子：

$|E\rang\rightarrow exp(\frac{-iEt}{\hbar})|E\rang$
薛定谔方程的解：（2021-07-16by 武汉大学数学李平学姐）
- 因为 $H$ 是 Hermitian 的，故酉相似于对角矩阵 $P^\dagger HP=P^{-1}HP=D=diag\{d_1,...,d_n\}$ 。
- 又因为 $PP^\dagger=I$ ，有 $i\hbar P^\dagger \frac{d|\psi\rang}{dt}=P^\dagger H(PP^\dagger)|\psi\rang$ ，即 $i\hbar\frac{dP^\dagger |\psi\rang}{dt}=DP^\dagger|\psi\rang$ 。
- 令 $|\phi\rang\equiv P^\dagger |\psi\rang$ ，即有 $i\hbar\frac{d|\phi\rang}{dt}=D|\phi\rang$ ，即线性微分方程组： $i\hbar\frac{d\phi_i}{dt}=d_i\phi_i$ 。
解得，有 $\phi_i=\phi_{i0}e^{\frac{-itd_i}{\hbar}}$ ，其中 $\phi_{i0}$ 为 $\phi_i$ 的初始值。写成矩阵形式，即 $|\phi\rang=e^{\frac{-itD}{\hbar}}|\phi_0\rang$ 。
- 而 $|\psi\rang=P|\phi\rang=Pe^{\frac{-itD}{\hbar}}(P^\dagger P)|\phi_0\rang$ 。
- 所以 $|\psi\rang=e^{\frac{-itPDP^\dagger}{\hbar}}P|\phi_0\rang=e^{\frac{-itH}{\hbar}}|\psi_0\rang$ 。
常有以下说法：

“把一个酉算子应用到一个特定的量子系统上”（applying a unitary operator to a particular quantum system），量子系统在和 “我们” 相互作用后将不再封闭。但状态向量仍可以用另一个 Hamilton 量相近似。

# 假设三：量子测量

假设 3：量子测量由一组测量算子 $\{M_m\}$ 描述，这些算子作用在被测系统状态空间上，指标 $m$ 表示实验中可能的测量结果。若在测量前，量子系统最新状态是 $|\psi\rang$ ，则结果 $m$ 发生的可能性是：

$p(m)=\lang\psi|M_m^\intercal M_m|\psi\rang=tr(|\psi\rang\lang\psi|M_m^\intercal M_m)$

且测量后系统的状态为：

$|\psi'\rang=\frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}}$

假设内容包括：测量算子 $M_m$ 满足完备性方程： $\sum_m M_m^\intercal M_m=I$ ，因此：

$\sum_mp(m)=\sum_mtr(|\psi\rang\lang\psi|M_m^\intercal M_m)=tr(|\psi\rang\lang\psi|\sum_mM_m^\intercal M_m)=tr(|\psi\rang\lang\psi|I)=\lang\psi|I|\psi\rang=1$
- 我自己对 “quantum measurement operator” 的理解：
  
  $M_m$ ，其中， $m$ 表示实验结果。譬如一个系统有状态 $|\psi_1\rang,|\psi_2\rang$ ，测量这个系统这样一个实验的结果只有 2 种 (1, 2)：
  - 若 $\lang\psi_1|M_1|\psi_1\rang=1,\lang\psi_1|M_2|\psi_1\rang=0$ ，我理解为：若系统状态为 $|\psi_1\rang$ ，则测量结果一定为 1.
    
    若 $\lang\psi_2|M_1|\psi_2\rang=0.75,\lang\psi_2|M_2|\psi_2\rang=0.25$ ，我理解为：若系统状态为 $|\psi_2\rang$ ，则有 75% 的概率测量到结果 1，25% 概率测量到结果 2.
    
    因此，在这样的假设下，若不知道系统状态下进行测量，若测量到结果 1，则无法确定系统是哪个状态；但如果测量到结果 2，则确定系统状态为 $|\psi_2\rang$ 。
  - 但若 $\lang\psi_1|M_1|\psi_1\rang=1,\lang\psi_1|M_2|\psi_1\rang=0,\lang\psi_2|M_1|\psi_2\rang=0,\lang\psi_2|M_2|\psi_2\rang=1$ ，则发现系统状态与实验结果是一一对应的。即出现结果 2，可以肯定系统状态是 $|\psi_2\rang$ ；出现结果 1，可以肯定系统状态是 $|\psi_1\rang$ 。
    
    若存在这样的测量实验（测量算子），则状态 $|\psi_1\rang,|\psi_2\rang$ 是可区分的。
  - 特别地，还有一种情况。若系统只有两个状态，某个测量实验却有三个测量结果。如果状态为 $|\psi_1\rang$ ，则测量结果一定为 1 或 2（至于是哪个不一定），如果状态为 $|\psi_2\rang$ ，则测量结果一定为 3。显然这时 $|\psi_1\rang,|\psi_2\rang$ 也是可区分的，也因为此时可以把 $M_1$ 和 $M_2$ 合并。所以我认为，如果两个状态是可区分的，则在合并测量算子后，只剩下和状态一一对应的测量算子。
关于可测量量（Observable）为什么可以用一个矩阵表示：

根据我的理解，在经典物理下，“测量” 就是

$系统状态\rightarrow测量结果$ 的映射。即对于不同的系统状态可以得出不同的测量结果。

在量子力学中，可以用线性空间中的矢量 $|\psi\rang$ 表示系统状态，而量子力学一大假设是测量结果一定是可测量量的本征值，且对应此时测量结果的系统状态为属于此本征值的本征矢。

所以我认为，将 “可测量量” 用一个形如 $M=\sum\lambda P_\lambda=\sum \lambda|\lambda\rang\lang\lambda|$ 的 Hermite 算子表示，其实就是，构造了一个测量算子，使得利用这个测量算子可以根据系统状态计算出各个结果出现的概率。

也就是说，可测量量的算子表示正好代表了一个测量实验，而这个测量算子正好可以用于根据系统状态来推断不同测量结果的概率（ $系统状态\rightarrow测量结果$ 的映射）。

根据我的理解，对于任意一个系统状态 $|A\rang$ ，采用测量算子 $P_\lambda$ ，则 $\lang A|P_\lambda|A\rang$ 就是系统状态为 $|A\rang$ 时，对其进行测量得到结果是 $\lambda$ 的概率（我认为是对系统进行测量！而不是对可测量量进行测量，可测量量只反映了可能的测量结果及其过程），特别地，若 $|A\rang$ 正交于测量算子 $M$ 的属于本征值 $\lambda$ 的本征空间，则概率为 0；否则概率为 $|A\rang$ 向 $\lambda$ 的本征空间投影的模长平方。

可测量量 = 对系统进行测量所有可能得到的结果以及系统状态信息的整合

# 证明非正交状态的不可区分：

设状态 $|\psi_1\rang,|\psi_2\rang$ 非正交。反设它们可区分，则存在测量算子 $M_1,M_2$ ，使得:

$\lang\psi_1|M_1^\intercal M_1|\psi_1\rang=1,\lang\psi_1|M_2^\intercal M_2|\psi_1\rang=0\\ \lang\psi_2|M_1^\intercal M_1|\psi_1\rang=0,\lang\psi_2|M_2^\intercal M_2|\psi_2\rang=1\\ \Rightarrow ||M_1|\psi_1\rang||=1,||M_2|\psi_1\rang||=0\\ ||M_1|\psi_2\rang||=0,||M_2|\psi_2\rang||=1$

此时因为 $|\psi_1\rang,|\psi_2\rang$ 不正交，则 $|\psi_2\rang=\alpha|\psi_1\rang+\beta|\psi\rang$ ，其中 $|\psi_1\rang$ 和 $|\psi\rang$ 正交，且 $|\alpha|^2+|\beta|^2=1,|\beta|< 1$

又因为：

$1=||M_2|\psi_2\rang||=||\alpha M_2|\psi_1\rang+\beta M_2|\psi\rang||\leq\alpha||M_2|\psi_1\rang||+\beta||M_2|\psi\rang||=\beta||M_2|\psi\rang||\\$

而

$||M_2|\psi\rang||^2\leq\lang\psi|M_1^\intercal M_1|\psi\rang+\lang\psi|M_2^\intercal M_2|\psi\rang=1$

所以:

$1=\beta||M_2|\psi\rang||\leq\beta<1$

矛盾，故证毕。

其实本质在于 $|\psi_1\rang$ 在 $|\psi_2\rang$ 上有分量，因此 $|\psi_2\rang$ 状态对应可能的测量结果，状态 $|\psi_1\rang$ 也一定会有一定概率产生这个结果，故不可区分。

物理含义	数学表象
Observable	Hermitian operator
Possible values (实验可能的结果)	Eigenvalues
States in which result is unambiguous	Eigenvectors

注意最后一个，States in which result is unambiguous 表示系统在这个状态时，根据实验测量结果可以断定出系统的状态。根据我的理解，此时系统的状态与实验结果是一一对应的。而这样的状态只能是可观测量的本征矢量。

# 投影测量

投影测量由被测量系统状态空间上的一个可观测量 Hermite 算子 M 描述，该可观测量具有谱分解：

$M=\sum_mmP_m$

其中， $P_m$ 为到特征值 m 的本征空间的投影算子（ $|\lambda=m\rang$ 为该本征空间的一组标准正交基）：

$P_m=\sum|\lambda=m\rang\lang\lambda=m|$

有 $P_m^\intercal P_m=P_m$

测量状态 $|\psi\rang$ 时，得到结果 m 的概率为：

$p(m)=\lang\psi|P_m^\intercal P_m|\psi\rang=\lang\psi|P_m|\psi\rang\\ 其实本质是|\psi\rang 在本征空间上投影的模长平方p(m)=||P_m|\psi\rang||^2$

测量后，状态变为

$|\psi'\rang=\frac{P_m|\psi\rang}{\sqrt{p(m)}}$

显然， $P_m$ 满足：

$\sum_mP_m^\intercal P_m=\sum_mP_m=I,P_m^\intercal=P_m$
投影测量有很多很好的性质：
- 测量结果期望
  $E(m)=\sum_mmp(m)=\sum_mm\lang\psi|P_m|\psi\rang=\lang\psi|\sum_mmP_m|\psi\rang=\lang\psi|M|\psi\rang$
  通常记 $\lang M\rang\equiv \lang\psi|M|\psi\rang=E(m)$ ，方差 $[\Delta(M)]^2=\lang M^2\rang-\lang M\rang^2$
Heisenberger 测不准原理

不妨设 $A,B$ 是 Hermite 矩阵，设 $\lang\psi|AB|\psi\rang=x+iy$

则有 $\lang\psi|[A,B]|\psi\rang=2iy,\lang\psi|\{A,B\}|\psi\rang=2x$ ，所以有：

$|\lang\psi|[A,B]|\psi\rang|^2+|\lang\psi|\{A,B\}|\psi\rang|^2=4|\lang\psi|AB|\psi\rang|^2$

又 Cauchy-Schwarz 不等式以及 $A,B$ 是 Hermite 的

$|\lang\psi|AB|\psi\rang|^2\leq\lang\psi|A^2|\psi\rang\lang\psi|B^2|\psi\rang$

所以有

$|\lang\psi|[A,B]|\psi\rang|^2\leq 4\lang\psi|A^2|\psi\rang\lang\psi|B^2|\psi\rang$

此时，令 $A=C-\lang C\rang I,B=D-\lang D\rang I$ ， $C,D$ 是两个可测量量的矩阵表示

有 $[A,B]=[C,D],\lang|\psi|A^2|\psi\rang=\lang\psi|C^2|\psi\rang-2\lang C\rang\lang\psi|C|\psi\rang+\lang C\rang ^2=\lang C^2\rang-\lang C\rang^2=(\Delta C)^2$

所以有：

$\Delta C\Delta D\geq\frac{|\lang\psi|[C,D]|\psi\rang|}{2}$
- 测不准原理的正确理解：制备具有相同状态 $|\psi\rang$ 的大量量子系统，并对其中一部分以测量算子 $C$ 去测量，另一部分以 $D$ 去测量。则测量的结果（ $C,D$ 的本征量）的标准差要满足上面不等式。

# POVM 测量

对于一个一般测量算子 $M_m$ ，定义半正定算子 $E_m\equiv M_m^\intercal M_m$ ，则有 $\sum_mE_m=I,p(m)=\lang\psi|E_m|\psi\rang$ 。于是算子集合 $E_m$ 足以确定不同测量结果的概率，算子 $E_m$ 称为与测量相联系的 POVM 元，完整的集合 $\{E_m\}$ 称为一个 POVM。
同样可以给出更自然的 POVM 定义：满足 (1) 每个算子 $E_m$ 是半正定的 (2) $\sum_mE_m=I$ 的算子集合 $\{E_m\}$ 是一个 POVM。（因为半正定性，也可以反求出 $M_m=\sqrt{E_m}$ 。
投影测量的可重复性：（根据我的理解）如果投影算子 $P_m$ 包含足够的维数，则 $P_m|\psi\rang=|\psi\rang$ （投影无信息损失），此时 $\lang\psi|P_m|\psi\rang=\lang\psi|\psi\rang=1$ , 所以有 $|\psi'\rang=\frac{P_m|\psi\rang}{\sqrt{\lang\psi|P_m|\psi\rang}}=|\psi\rang$ ，即无论进行多少次投影测量都不会改变系统的状态。
注意 POVM 测量并不等价于一般测量！对于一个一般测量 $\{M_m\}$ ，可对应唯一一个 POVM： $\{E_m=M_m^\intercal M_m\}$ ，但是给出一个 POVM $\{E_m\}$ ，你却不能直接得出一般测量 $\{M_m=\sqrt{E_m}\}$ ，因为只要 $M_m=U\sqrt{E_m},U$ 是酉的就都满足 $M_m^\intercal M_m=E_m$ 。这也应证了 POVM 为什么用于 “只关心概率结果而不关心系统测量后的状态”，因为给出 $E_m$ 可以测出概率，但无法得出 $M_m$ 也就无法得到系统测量后进入的状态。
* 存在系统可能的状态集合以及一个 POVM，使得根据测量结果推断出的系统状态不会出错，但是这是以有时候无法判断为代价。

# 相位（phase）

全局相位因子： $e^{i\theta}$ ，状态 $e^{i\theta}|\psi\rang$ 与 $|\psi\rang$ 在统计意义上是相同的。因为 $\lang\psi|e^{-i\theta}M^\intercal Me^{i\theta}|\psi\rang=\lang\psi|M^\intercal M|\psi\rang$
相对相位：如果两个模长相同的幅度 a，b 满足 $a=e^{i\theta}b$ ，则我们说幅度 a，b 差了一个相对相位。

特别地，若两个状态 $|\psi_1\rang,|\psi_2\rang$ 在这同一组基下每个幅度都差了一个相对相位，则称这两个状态在这组基下差了一个相对相位。

相对相位与全局相位不同之处在于相对相位需要依赖基的选择。在某个基下差了相对的相位的状态有物理统计差别，而差了全局相位的状态却没有。

# 假设四：复合系统

假设 4：复合物理系统的状态空间是分物理系统状态空间的张量积，若将分系统编号为 1 到 n，系统 i 的状态为 $|\psi_i\rang$ ，则系统的总状态为 $|\psi_1\rang\otimes...\otimes|\psi_n\rang$ 。
一个算不上推导的解释：为什么选择张量积来描述联合系统的状态？

由叠加性原理：若 $|x\rang,|y\rang$ 是系统的两个状态，则它们的任意叠加 $\alpha|x\rang+\beta|y\rang$ 也应该是系统的一个状态，其中 $|\alpha|^2+|\beta|^2=1$ 。

考虑系统 A 的一个状态 $|v\rang$ ，系统 B 的两个状态 $|w_1\rang,|w_2\rang$ ，系统 AB 的两个状态 $|v\rang\otimes|w_1\rang,|v\rang\otimes|w_2\rang$ ，则显然对于任意 $|\alpha|^2+|\beta|^2=1$ ，都有 $\alpha(|v\rang\otimes|w_1\rang)+\beta(|v\rang\otimes|w_2\rang)=|v\rang\otimes(\alpha|w_1\rang\otimes\beta|w_2\rang)$ ，其中 $|v\rang,\alpha|w_1\rang\otimes\beta|w_2\rang$ 分别是系统 A,B 的状态，所以 $\alpha(|v\rang\otimes|w_1\rang)+\beta(|v\rang+|w_2\rang)$ 也是联合系统 AB 的状态。

其实我认为满足这样性质的运算有很多，方便选了张量积。
关于一个投影测量加上一个酉算子就可以实现一般测量：

设有一个状态空间为 Q 的量子系统，希望在系统 Q 上进行由算子 $M_m$ 定义的测量。

引入一个辅助系统，其状态空间为 M。该系统有一个与测量结果一一对应的标准正交基 $|m\rang$ （即 $\lang m'|M_m^\intercal M_m|m'\rang\equiv m==m'?1:0$ ）。

设 M 有一个状态为 $|0\rang$ ，对于 Q 中所有状态 $|\psi\rang$ ，在 $|\psi\rang\otimes|0\rang$ 上定义酉算子 U:

$U(|\psi\rang\otimes|0\rang)\equiv\sum_m (M_m|\psi\rang)\otimes|m\rang$

因此有:

$(U(|\psi_1\rang\otimes |0\rang),U(|\psi_2\rang\otimes|0\rang))=\sum_{m,m'}((M_m|\psi_1\rang)\otimes|m\rang)^\intercal((M_{m'}|\psi_2\rang)\otimes|m'\rang)\\ =\sum_{m,m'}((\lang\psi_1|M_m^\intercal)\otimes\lang m|)((M_{m'}|\psi_2\rang)\otimes|m'\rang)\\ =\sum_{m,m'}\lang\psi_1|M_m^\intercal M_{m'}|\psi_2\rang\lang m|m'\rang=\lang\psi_1|\sum_mM_m^\intercal M_m|\psi_2\rang=\lang\psi_1|\psi_2\rang$

可以发现如此定义的酉算子 $U:Span\{|\psi\rang\otimes|0\rang\}\rightarrow Q\otimes M$ 是保持内积的。

由 Ex2.67，存在一个扩张到酉算子 $U':Q\otimes M\rightarrow Q\otimes M$ ，使得 $\forall |w\rang \in Span\{|\psi\rang\otimes|0\rang\},U'|w\rang\equiv U|w\rang$ (证明在下面)

令 $U'$ 作用于 $|\psi\rang\otimes|0\rang$ ，考虑对复合系统的投影测量算子 $P_m=I_Q\otimes(|m\rang\lang m|)$

$p(m)=\sum_{m',m''}[(\lang\psi|M_{m'}^\intercal)\otimes\lang m'|]\cdot[I_Q\otimes|m\rang\lang m|]\cdot[(M_{m''}|\psi\rang)\otimes|m''\rang]\\ =\sum_{m',m''}\lang\psi|M_{m'}^\intercal I_QM_{m''}|\psi\rang\cdot[\lang m'|m\rang\lang m|m''\rang]\\ =\lang\psi|M_m^\intercal M_m|\psi\rang$

测量后系统状态变为:

$\frac{P_mU(|\psi\rang\otimes|0\rang)}{\sqrt{p(m)}}=\frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}}\otimes |m\rang$

其中，M 系统状态 $|m\rang$ 被测量不会发生变化，而 Q 系统状态变为 $\frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}}$ ，就此借用酉算子 + 引入辅助系统实现了对 Q 系统的一般测量。
- 关于 Ex2.67*“设 V 是 Hilbert 空间且 W 是其子空间。设 $U:W\rightarrow V$ 是一个保持内积的线性算子，即 $\forall |w_1\rang,|w_2\rang \in W,\lang w_1|U^\intercal U|w_2\rang=\lang w_1|w_2\rang$ 。求证存在 U 的扩张算子 $U':V\rightarrow V$ ，使得 $U'|w\rang\equiv U|w\rang$ 。”*
其实复合系统状态记号很多样。根据我的理解 $|vw\rang=|v\rang|w\rang=|v\rang\otimes|w\rang$

# 纠缠

考虑双量子比特系统状态 $|\psi\rang=\frac{|00\rang+|11\rang}{\sqrt2}$ ，它并不能表示为两个单量子比特系统状态的（张量）积。复合系统这种独特的状态称为纠缠态（entangled state），起因尚不明确。

# 总览

假设 1 说明了如何描述一个孤立的量子系统的状态；假设 2 说明封闭量子系统的动态由薛定谔方程，也就是酉演化来描述；假设 3 说明了如何通过规定测量的描述来从量子系统获取信息；假设 4 说明如何将不同的量子系统合成复合系统。
量子力学不同于传统经典力学在于无法直接观察系统的状态向量。因此诸如位置，能量，速率等经典力学里可以直接观测的量在量子力学中将变得不再基本。量子系统好像一个隐藏和封闭的世界，每次观测都将引起状态的改变。

# 初等量子力学的一个应用：超密编码

问题：Alice 要给 Bob 传输一份两个经典比特的信息 (00, 01, 10, 11)，但却只被允许发送一个量子比特。
首先，Alice 和 Bob 共享一对纠缠态的量子比特 $|\psi\rang=\frac{|00\rang+|11\rang}{\sqrt2}$ ，Alice 拥有第一个量子比特，Bob 拥有第二个量子比特。
- 若想传输 00，Alice 作用 I 于第一量子比特上: $|\psi'\rang=I_1|\psi\rang=\frac{|00\rang+|11\rang}{\sqrt{2}}$
- 若想传输 01，Alice 作用 Z 于第一量子比特上: $|\psi'\rang=Z_1|\psi\rang=\frac{|00\rang-|11\rang}{\sqrt{2}}$
- 若想传输 10，Alice 作用 X 于第一量子比特上: $|\psi'\rang=X_1|\psi\rang=\frac{|10\rang+|01\rang}{\sqrt{2}}$
- 若想传输 11，Alice 作用 iY 于第一量子比特上: $|\psi'\rang=iY_1|\psi\rang=\frac{-|10\rang+|01\rang}{\sqrt{2}}$
作用后得到的四个状态称为 Bell 态（或 Bell 基，EPR 对）不难验证它们是正交的。因此在 Alice 将第一个量子比特发送给 Bob 后，Bob 可以通过测量实验可靠区分这四种状态，即得到了传输的信息。事实上，传输信息的过程 Alice 永远不需要和第二个量子比特打交道。
特别地，若有人劫持了 Alice 发的第一个量子比特，由于对于任意测量算子 $M_m$ ， $\lang\psi|M_m^\intercal M_m\otimes I|\psi\rang$ 结果都一样，则劫持者也无法只通过第一个量子比特解密信息。

# 密度算子

密度算子是一种数学上等价于状态向量的可以用来描述量子力学的工具。

# 量子状态的综述

设量子系统以概率 $p_i$ 处在一组状态 $\{|\psi_i\rang\}$ 中的某一个，则称 $\{p_i,|\psi_i\rang\}$ 为一个纯态的系综（ensemble of pure state），系统的密度算子（密度矩阵）定义为：

$\rho\equiv\sum_ip_i|\psi_i\rang\lang\psi_i|$
封闭量子系统的演化由酉算子来描述。系统初态为 $|\psi_i\rang$ 的概率为 $p_i$ ，则演化发生后，系统会以概率 $p_i$ 进入状态 $U|\psi_\rang$ 。于是：

$\rho'=\sum_ip_iU|\psi_i\rang\lang\psi_i|U^\intercal=U\rho U^\intercal$

观测算子 $M_m$ 测量系统时，

$p(m)=\sum_ip(测量结果为m|系统状态为i)*p_i\\ =\sum_i\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i\\ =\sum_itr(M_m^\intercal M_m|\psi_i\rang\lang\psi_i|)p_i\\ =tr(M_m^\intercal M_m\rho)$

考虑测量后的状态：

$|\psi_i^m\rang=\frac{M_m|\psi_i\rang}{\sqrt{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang}}\\$

注意： $|\psi_i^m\rang$ 是得到结果为 m 之后的状态！因此在计算测量得到结果为 m 后的密度算子 $\rho_m$ 时，应为：

$\rho_m=\sum_ip(系统状态为i|得到测量结果m)|\psi_i^m\rang\lang\psi_i^m|\\$

由概率论基本原理，有： $p(i|m)=\frac{p(im)}{p(m)}=\frac{p(m|i)p(i)}{p(m)}=\frac{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i}{tr(M_m^\intercal M_m\rho)}$ ，所以：

$\rho_m=\sum_i\frac{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i}{tr(M_m^\intercal M_m\rho)}\cdot \frac{M_m|\psi_i\rang\lang\psi_i|M_m^\intercal}{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang}=\frac{M_m\rho M_m^\intercal}{tr(M_m^\intercal M_m\rho)}$
处于某一个精确已知状态的量子系统称为处于纯态（pure state）。在这种情况下， $\rho=|\psi\rang\lang\psi|$ 。否则，就处于混合态（mixed state），是在 $\rho$ 的系综中不同纯态的混合.

显然，对于一个纯态， $tr(\rho^2)=tr(|\psi\rang\lang\psi|\psi\rang\lang\psi|)=\lang\psi|\psi\rang\lang\psi|\psi\rang=1$ , 而对于一个混合态， $tr(\rho^2)<1$ . 有时人们用混合态表示纯态和混合态 (可以把纯态看作特殊的混合态).
混合态密度算子计算：如果系统以概率 $p_i$ 处于某混合态 $\rho_i$ (注意这里不是纯态的系综了！), 则系统的密度算子为 $\rho=\sum_i p_i\rho_i$ . 证明如下:

不妨记 $\rho_i=\sum_jp_{ij}|\psi_{ij}\rang\lang\psi_{ij}|$ 其中 $\{p_{ij},|\psi_{ij}\rang\}$ (i 固定) 是一个纯态的系综。则

$\rho=\sum_{i,j}(p_i*p_{ij})|\psi_{ij}\rang\lang\psi_{ij}|=\sum_ip_i\sum_jp_{ij}|\psi_{ij}\rang\lang\psi_{ij}|=\sum_ip_i\rho_i$

称 $\rho$ 为具有概率 $p_i$ 的状态 $\rho_i$ 的混合.
因此，可以考虑混合态测量后的进入的混合态:

$\rho'=\sum_mp(m)\rho_m$

其中，如果系统得到结果为 m, 则系统会进入状态 $\rho_m$ . 即测量后系统以概率为 $p(m)$ 处于状态 $\rho_m$ . 故测量后系统状态为:

$\rho'=\sum_mp(m)\rho_m=\sum_mtr(M_m^\intercal M_m\rho)\frac{M_m\rho M_m^\intercal}{tr(M_m^\intercal M_m\rho)}=\sum_mM_m\rho M_m^\intercal$

# 密度算子的特征

一个算子 $\rho$ 是和某个系综 $\{p_i,|\psi_i\rang\}$ 相联系的密度算子，当且仅当：
- $tr(\rho)=1$
- $\rho$ 是半正定的。
证明如下：

若 $\rho$ 是密度算子，有 $tr(\rho)=\sum_i p_itr(|\psi_i\rang\lang\psi_i|)=\sum_ip_i\lang\psi_i|I|\psi_i\rang=\sum_ip_i=1$ ， $\lang\varphi|\rho|\varphi\rang=\sum_ip_i|\lang\varphi|\psi\rang|^2\geq 0$ 。

反过来，因为 $\rho$ 是半正定算子，有谱分解 $\rho=\sum_j\lambda_j|j\rang\lang j|$ ，其中 $\lambda_j$ 为非负特征值， $|j\rang$ 是正交的。又因为 $\sum_j\lambda_j=1$ ，所以 $\rho$ 可以和系综 $\{\lambda_i,|i\rang\}$ 联系起来。

# 四大假设的重写：

假设 1：孤立的量子系统状态仍与 Hilbert 空间相关联，但系统可以被一个作用在状态空间上的密度算子完全描述，密度算子是一个迹为 1 的半正定算子。如果系统以概率 $p_i$ 处于状态 $\rho_i$ ，则系统状态为 $\sum_ip_i\rho_i$
假设 2：封闭量子系统的演化由一个酉变换描述，即： $\rho(t_2)=U\rho(t_1)U^\intercal$ ，其中 $U$ 只依赖 $t_1,t_2$ 。
假设 3：处于状态为 $\rho$ 的系统在一组测量算子 $\{M_m\}$ 的测量下，得到结果为 $m$ 的概率为 $p(m)=tr(M_m^\intercal M_m\rho)$ ，若得到结果 $m$ ，则测量后系统状态为 $\frac{M_m\rho M_m^\intercal}{tr(M_m^\intercal M_m\rho)}$ ，其中测量算子满足： $\sum M_m^\intercal M_m=I$ 。
假设 4：复合物理系统的密度算子是各分系统的张量积： $\rho=\rho_1\otimes...\otimes\rho_n$ 。

# 密度矩阵系综中的酉自由度

考虑状态 $|0\rang,|1\rang$ ，若让系统以 $\frac{3}{4}$ 概率处于状态 $|0\rang$ ，以 $\frac{1}{4}$ 概率处于状态 $|1\rang$ ，则其密度矩阵为 $\rho=\frac{3}{4}|0\rang\lang 0|+\frac{1}{4}|1\rang\lang 1|$ 。

考虑状态 $|\alpha\rang=\sqrt{\frac{3}{4}}|0\rang+\sqrt{\frac{1}{4}}|1\rang,|\beta\rang=\sqrt{\frac{3}{4}}|0\rang-\sqrt{\frac{1}{4}}|1\rang$ ，让系统以 $\frac{1}{2}$ 概率处于状态 $|\alpha\rang$ ，以 $\frac{1}{2}$ 概率处于状态 $|\beta\rang$ 。则系统密度矩阵为： $\rho=\frac{1}{2}|\alpha\rang+\frac{1}{2}|\beta\rang=\frac{3}{4}|0\rang\lang 0|+\frac{1}{4}|1\rang\lang 1|$ 。所以其实密度矩阵的本征值和本征矢只能描述众多系综中的一种。下面考虑怎样的两个系综会产生同样的密度算子。
定理：对于系综 $\{p_i,|\psi_i\rang\}$ 和 $\{q_i,|\varphi_i\rang\}$ ，当且仅当：

$\sqrt{p_i}|\psi_i\rang=\sum_j u_{ij}\sqrt{q_j}|\varphi_j\rang$

时，与两个系综相关联的密度矩阵相等。（ $(u_{ij})$ 是一个酉矩阵）注意要向较小的系综中补充零向量直至俩系综大小相等。
- 证明：
$\rho_1=\sum_i\sqrt{p_i}|\psi_i\rang\lang\psi_i|\sqrt{p_i}=\sum_i\sum_{j,k}u_{ij}u_{ik}^*\sqrt{q_j}|\varphi_j\rang\lang\varphi_k|\sqrt{q_k}\\ =\sum_{j,k}(\sum_iu_{ij}u_{ik}^*)\sqrt{q_j}|\varphi_j\rang\lang\varphi_k|\sqrt{q_k}$

因为 $U^\intercal U=I$ ，考虑 $U^\intercal$ 的第 k 行去乘 $U$ 的第 j 列：\delta_{kj}=\sum_i U_{ki}^\intercal U_{ij}=\sum_iu_{ik}^*u_

所以 $\rho_1=\sum_{j,k}\delta_{kj}\sqrt{q_j}|\varphi_j\rang\lang\varphi_k|\sqrt{q_k}=\sum_j\sqrt{q_j}|\varphi_j\rang\lang\varphi_j|\sqrt{q_j}=\rho_2$ 。

反过来，设 $\rho=\sum_i\sqrt{p_i}|\psi_i\rang\lang\psi_i|\sqrt{p_i}=\sum_i\sqrt{q_i}|\varphi_i\rang\lang\varphi_i|\sqrt{q_i}$ 。 $\rho$ 是厄米特的，考虑其一个谱分解 $\rho=\sum_k\lambda_k|k\rang\lang k|$ ，取 $|k\rang$ 标准正交。令 $|\phi\rang$ 是任意一个正交于 $Span\{\sqrt{\lambda_k}|k\rang\}$ 的一个矢量，则:

$\lang\phi|A|\phi\rang=\sum_k\lambda_k\lang\phi|k\rang\lang k|\phi\rang=0\\ 又因为\lang\phi|A|\phi\rang=\sum_ip_i\lang\phi|\psi_i\rang\lang\psi_i|\phi\rang=\sum_i|\lang\phi|\sqrt{p_i}|\psi_i\rang|^2\\ 所以有\lang\phi|\sqrt{p_i}|\psi_i\rang\equiv 0$

因为： $|\phi\rang$ 正交于 $Span\{\sqrt{\lambda_k}|k\rang\}\Rightarrow|\phi\rang$ 正交于 $Span\{\sqrt{p_i}|\psi_i\rang\}$ ，所以后者是前者的子空间，每个 $\sqrt{p_i}|\psi_i\rang$ 都可用 $\sqrt{\lambda_k}|k\rang$ 线性表示：

$\sqrt{p_i}|\psi_i\rang=\sum_k c_{ik}\sqrt{\lambda_k}|k\rang$

所以

$\sum_k\lambda_k|k\rang\lang k|=\rho=\sum_i\sqrt{p_i}|\psi_i\rang\lang\psi_i|\sqrt{p_i}=\sum_{k_1,k_2}(\sum_ic_{ik_1}c_{ik_2}^*)\sqrt{\lambda_{k_1}}|k_1\rang\lang k_2|\sqrt{\lambda_{k_2}}$

又因为算子组 $|k_1\rang\lang k_2|$ 是正交的，所以当且仅当 $k_1=k_2$ 时， $\sum_ic_{ik_1}c_{ik_2}^*$ 才能取 1，否则都是 0，这样右式才能等于左式。

所以补齐零向量后， $\sqrt{p_i}|\psi_i\rang=\sum_k c_{ik}\sqrt{\lambda_k}|k\rang$ ，这里 $(c_{ij})$ 是个酉矩阵 (因为 $\forall k_1,k_2,\sum_ic_{ik_2}^*c_{ik_1}=\delta_{k_1k_2}$ )。同理：

$\sqrt{p_i}|\psi_i\rang=\sum_kc_{ik}\sqrt{\lambda_k}|k\rang\\ \sqrt{q_i}|\varphi_i\rang=\sum_kw_{ik}\sqrt{\lambda_k}|k\rang$

其中， $(c_{ik}),(w_{ik})$ 都是酉的。故有：

$\sqrt{p_i}|\psi_i\rang=\sum_j u_{ij}\sqrt{q_j}|\varphi_j\rang$

其中 $(u_{ij})=cw^\intercal$ 也是酉的。证毕。

# 关于 Bloch 球面

在 Ex2.72 中证明了对于任意密度算子 $\rho$ ，都能将其表示为 $\rho=\frac{1}{2}(I+\overrightarrow{v}\cdot\overrightarrow{\sigma} )$ ，先考虑一个纯态， $|\overrightarrow{r}|=1$ 。

不妨用三维单位球面上一点 $\overrightarrow{r}=(sin\theta cos\phi,sin\theta sin\phi,cos\theta)$ ，则有

$\rho=\frac{1}{2}\begin{pmatrix}1+cos\theta&e^{-i\phi}sin\theta\\e^{i\phi}sin\theta&1-cos\theta\end{pmatrix}$

用二倍角展开后，有 $|\psi\rang=cos\frac{\theta}{2}|0\rang+e^{i\phi}sin\frac{\theta}{2},|\psi\rang\lang\psi|=\rho$

* 特别地，当且仅当 $|\overrightarrow{r}|=1$ 时，该状态为纯态。

# 约化密度算子

假设有物理系统 A，B，A 和 B 的复合系统的密度算子是 $\rho^{AB}$ 。则针对系统 A 的约化密度算子 $\rho^A=tr_B(\rho^{AB})$ 。其中 $tr_B$ 是一个算子映射，称为系统 B 上的偏迹。定义为：

$tr_B(|a_1\rang\lang a_2|\otimes|b_1\rang\lang b_2|)=|a_1\rang\lang a_2|tr(|b_1\rang\lang b_2|)=\lang b_2|b_1\rang|a_1\rang\lang a_2|$

若 AB 的状态为 $\rho\otimes\sigma$ 则系统 A 的状态为 $\rho^A=tr_ B(\rho\otimes\sigma)=\rho tr(\sigma)=\rho,\rho^B=\sigma$
考虑 Bell 态 $\frac{|00\rang+|11\rang}{\sqrt{2}}$ 的纯态密度算子 $\rho=(\frac{|00\rang+|11\rang}{\sqrt{2}})(\frac{\lang 00|+\lang 11|}{\sqrt{2}})$ , $\rho=\frac{|00\rang\lang 00|+|11\rang\lang 00|+|00\rang\lang 11|+|11\rang\lang 11|}{2}$ 。

对第二量子比特取迹，得到第一量子比特的约化密度算子：

$\rho^1=\frac{|0\rang\lang 0|tr(|0\rang\lang 0|)+|1\rang\lang 0|tr(|1\rang\lang 0|)+|0\rang\lang 1|tr(|0\rang\lang 1|)+|1\rang\lang 1|tr(|1\rang\lang 1|)}{2}=\frac{|0\rang\lang 0|+|1\rang\lang 1|}{2}=\frac{I}{2}$

注意到 $tr((\rho^1)^2)=\frac{1}{2}<1$ ，所以第一量子比特是个混合态。联合系统的状态已知（是纯态），而子系统却处于混合态。这是量子纠缠现象的另一特点。
为什么选择偏迹（partial trace）？（这部分理解模糊，掺杂大量个人理解）

首先，单量子比特系统状态为 $\rho$ ，在投影测量 $P_m=|m\rang\lang m|$ 下 $p(m)=tr(P_m\rho)$

现在，双量子比特系统状态为 $\rho\otimes\sigma$ ，在投影测量 $P_m'=|m\rang\lang m|\otimes I$ 下测量概率为：

$p(m)=tr((P_m\otimes I)(\rho\otimes\sigma))=tr(P_m\rho\otimes\sigma)=tr(P_m\rho)tr(\sigma)=tr(P_m\rho)$ 。

所以投影测量 $P_m'$ 就是在保证系统观测统计信息不变的情况下 $P_m$ 在复合系统上的扩张。

下面我们寻找一个逆变换，已知有复合系统状态 $\rho^{AB}$ ，且 $p(m)=tr((P_m\otimes I)\rho^{AB})$ ，需要求出子系统状态，满足：
$p(m)=tr(P_m\rho^A)=tr((P_m\otimes I)\rho^{AB})$ 。对每个 m 都成立（注意扩张算子一定是 $P_m$ 和 $I$ 的张量积，否则测量结果将不是 1~m，将无法找出保持测量结果的扩张。我们求的是子系统状态而不是子测量算子）

不妨设 $\rho^A=f(\rho^{AB})$ 。不难证明 $(A,B)=tr(AB)$ 也是一个合法的内积形式。于是可以借此内积找出一组标准正交基：\
- 这里简单说明下 $(P_i,P_j)=tr(P_iP_j)=tr(|i\rang\lang i|j\rang\lang j|)=0$ 所以正交
  
  $|P_i|=\sqrt{(P_i,P_i)}=\sqrt{tr(|i\rang\lang i|i\rang\lang i|)}=1$ 所以标准
将 $\rho^A$ 分解到这组标准正交基上，可见

$f(\rho^{AB})=\sum_iP_i(f(\rho^{AB}),P_i)=\sum_iP_itr(P_if(\rho^{AB}))=\sum_i P_itr((P_i\otimes I)\rho^{AB})$

注意到，在这组标准正交基下的坐标已经求出且唯一。故 $f(\rho^{AB})$ 是唯一的。

不难验证 $\rho^A=f(\rho^{AB})=\rho tr(\sigma)=\rho$ 满足 $tr(P_m\rho^A)=tr((P_m\otimes I)\rho^{AB})$

即找到了唯一一个映射 $\rho^{AB}=\rho\otimes\sigma\in H\otimes W\rightarrow \rho^A=\rho\in H$ 保持统计信息。

# 初等量子力学的一个一个应用：量子隐形传态

假设 Alice 和 Bob 共享一个 Bell 态（以 $\frac{|00\rang+|11\rang}{\sqrt{2}}$ 为例），Alice 拥有第一量子比特，Bob 拥有第二量子比特。现在 Alice 有一个单量子比特的状态 $|\psi\rang=\alpha|0\rang+\beta|1\rang$ 的信息想传给 Bob，但她只能传输经典信息。
- 首先，将它们看成一个整的复合量子系统状态
  
  $|\phi\rang=|\psi\rang\otimes\frac{|00\rang+|11\rang}{\sqrt{2}}=\frac{1}{\sqrt{2}}(\alpha|0\rang(|00\rang+|11\rang)+\beta|1\rang(|00\rang+|11\rang))$
  
  Alice 手上有第一个量子比特和第二个量子比特。
- Alice 把第一个量子比特和第二个量子比特送入受控非门：
  
  $|\phi\rang=\frac{1}{\sqrt{2}}(\alpha|0\rang(|00\rang+|11\rang)+\beta|1\rang(|10\rang+|01\rang))$
  
  * 受控非门即：当且仅当第一量子比特为 $|1\rang$ ，第二量子比特取非。
- Alice 把第一个量子比特送入 Hadamard 门：
  
  $|\phi\rang=\frac{1}{2}[\alpha(|0\rang+|1\rang)(|00\rang+|11\rang)+\beta(|0\rang-|1\rang)(|10\rang+|01\rang)]$
  
  重新分配，可得:
  
  $|\phi\rang=\frac{1}{2}[|00\rang(\alpha|0\rang+\beta|1\rang)+|01\rang(\beta|0\rang+\alpha|1\rang)+|10\rang(\alpha|0\rang-\beta|1\rang)+|11\rang(\alpha|1\rang-\beta|0\rang)]$
  
  为六个三量子比特状态的叠加态。
- 由于 $|00\rang,|01\rang,|10\rang,|11\rang$ 是正交的，Alice 可以通过测量准确区别出自己手中两个量子比特的状态（就四种）。譬如投影测量
  
  $P_1=|00\rang\lang00|,P_2=|01\rang\lang 01|,P_3=|10\rang\lang 10|,P_4=|11\rang\lang 11|$
  
  进行测量后，Alice 可以得到测量结果，分别以 1/4 的概率得到结果 1,2,3,4。
  - 若得到结果 1，则系统状态进入 $|\phi'\rang=\frac{P_1|\phi\rang}{\sqrt{\lang\phi|P_1|\phi\rang}}=|00\rang(\alpha|0\rang+\beta|1\rang)$ 状态。
    
    此时将得到的结果 1 的消息发给 Bob，Bob 就知道自己手里的量子比特状态就是 $|\psi\rang$
  - 若得到结果 2，则系统进入 $|\phi'\rang=|01\rang(\beta|0\rang+\alpha|1\rang)$ 状态。
    
    此时将得到结果 2 的消息发给 Bob，Bob 将自己手中的量子比特送入非门，就得到了 $|\psi\rang$
  - 若得到结果 3，则系统进入 $|\phi'\rang=|10\rang(\alpha|0\rang-\beta|1\rang)$ 状态。
    
    此时将得到结果 3 的消息发给 Bob，Bob 将自己手中的量子比特送入 Z 门，就得到了 $|\psi\rang$
  - 若得到结果 4，则系统进入 $|\phi'\rang=|11\rang(\alpha|1\rang-\beta|0\rang)$ 状态。
    
    此时将得到结果 4 的消息发给 Bob，Bob 将自己手中的量子比特先送入 X 门，再送入 Z 门，就得到了 $|\psi\rang$
- 至此 $|\psi\rang$ 的信息已经传到了 Bob 手中。
考虑 Alice 测量后系统的状态，系统分别以 1/4 的概率处于 $|00\rang(\alpha|0\rang+\beta|1\rang),|01\rang(\beta|0\rang+\alpha|1\rang),|10\rang(\alpha|0\rang-\beta|1\rang)$ 和 $|11\rang(\alpha|1\rang-\beta|0\rang)$ 状态（即是这四个状态都以幅度为 1/2 的叠加态）。

所以测量后系统的密度算子为

$\rho=\frac{1}{4}[\\ |00\rang(\alpha|0\rang+\beta|1\rang)\lang 00|(\alpha^*\lang 0|+\beta^*\lang 1|)+\\ |01\rang(\beta|0\rang+\alpha|1\rang)\lang 01|(\beta^*\lang 0|+\alpha^*\lang 1|)+\\ |10\rang(\alpha|0\rang-\beta|1\rang)\lang 10|(\alpha^*\lang 0|-\beta^*\lang 1|)+\\ |11\rang(\alpha|1\rang-\beta|0\rang)\lang 11|(\alpha^*\lang 1|-\beta^*\lang 0|) \\ ]$

Bob 手中的单量子比特的约化密度算子为 $\rho^B=tr_A(\rho)=\frac{I}{2}$ 不依赖于 $|\psi\rang$ 。所以此时 Bob 进行的任何测量都测不出 $|\psi\rang$ 。只有 Bob 接受了来自 Alice 的测量结果后才可以针对性的进行状态变换。这也验证了量子信息传递仍需等待经典信息传输，不可超光速。

# Schmidt 分解和纯化

(Schmidt 分解定理) 设 $|\psi\rang$ 是复合系统 AB 的一个纯态，则存在系统 A 的标准正交基 $|i_A\rang$ 和系统 B 的标准正交基 $|i_B\rang$ ，使得：

$|\psi\rang=\sum_i\sqrt{\lambda_i}|i_{Ai}\rang\otimes|i_{Bi}\rang$

其中， $\lambda_i$ 是空间密度算子 $\rho^A,\rho^B$ 的本征值 (可以证明它们本征值一样) $\sum_i\lambda_i=1$ 且为非负实数，称为 Schmidt 系数。

证明：（先考虑 A,B 维数相同的情况）

首先，根据复合系统以及张量积的性质， $|i\rang\otimes|i\rang$ 已经构成了复合系统 AB 向量状态空间的一组标准正交基。故 $|\psi\rang$ 可写成它们的线性组合。对于某个复数矩阵 $(a_{ij})$ :

$|\psi\rang=\sum_{i,j}a_{ij}|i\rang\otimes|j\rang$

由奇异值分解 $(a_{ij})=A=UDV$ ，其中 D 是非负实对角阵，U,V 是酉矩阵。故：

$|\psi\rang=\sum_{i,j,k}u_{ik}d_{kk}v_{kj}|i\rang\otimes|j\rang$

令 $|i_{Ak}\rang\equiv\sum_iu_{ik}|i\rang,|i_{Bk}\rang\equiv\sum_jv_{kj}|j\rang,\lambda_k\equiv d_{kk}^2$ ，则 $|\psi\rang=\sum_k\sqrt{\lambda_k}|i_{Ak}\rang\otimes|i_{Bk}\rang$

由于 U,V 的酉性，验证 $|i_A\rang$ 构成一组标准正交基：

$\lang i_{Ak}|i_{Ak}\rang=\sum_i u_{ik}^*u_{ik}=\sum_i u_{ki}u_{ik}=1\\ \lang i_{Ak_1}|i_{Ak_2}\rang=\sum_i u_{ik_1}^*u_{ik_2}=0\\ (考虑U^\intercal U=I，第k_1行乘第k_2列)$

若 A，B 维数不同可以补一些零向量和给 A 添行 / 列使得 A 仍为方阵。
简单结论：设 $|\psi\rang$ 是复合系统 AB 的一个纯态，则 $|\psi\rang=\sum_i\sqrt{\lambda_i}|i_{Ai}\rang\otimes |i_{Bi}\rang$ ，那么 $\rho^{AB}=|\psi\rang\lang\psi|=\sum_{i,j}\sqrt{\lambda_i\lambda_j}|i_{Ai}\rang\lang i_{Aj}|\otimes |i_{Bi}\rang\lang i_{Bj}|$ ，那么子系统 A 的约化密度算子 $\rho^A=\sum_{i,j}\sqrt{\lambda_i\lambda_j}|i_{Ai}\rang\lang i_{Aj}|tr(|i_{Bi}\rang\lang i_{Bj}|)=\sum_i\lambda_i|i_{Ai}\rang\lang i_{Ai}|$ , 子系统 B： $\rho^B=\sum_i\lambda_i|i_{Bi}\rang\lang i_{Bi}|$ ，发现子系统 A，B 的密度算子本征值相同，这将带来很好的性质。
基 $|i_A\rang,|i_B\rang$ 分别称为 A 和 B 的 Schmidt 基，非零 $\lambda_i$ 的个数称为状态 $|\psi\rang$ 的 Schmidt 数（它在某种意义下反映了系统 A 和 B 的纠缠的 “量”）。Schmidt 分解在酉变换下保持不变。 $|\psi\rang=\sum_i\lambda_i|i_{Ai}\rang\otimes| i_{Bi}\rang$ ，则 $U|\psi\rang=\sum_i\lambda_i(U|i_{Ai}\rang)\otimes|i_{Bi}$ ，其中，U 是定义并作用在在系统 A 上的酉算子。
（纯化）考虑系统 A 的状态 $\rho^A$ ，它有个标准正交分解 $\rho^A=\sum_i p_i|i\rang\lang i|$ ，构造系统 R，与 A 有相同的状态空间。为复合系统定义纯态：

$|\psi\rang=\sum_i\sqrt{p_i}|i\rang|i^R\rang$ ，其中 $|i^R\rang$ 是系统 R 的一组标准正交基。则 $\rho^{AR}=|\psi\rang\lang\psi|=\sum_{i,j}\sqrt{p_ip_j}(|i\rang\lang j|)\otimes(|i^R\rang\lang j^R|)$ 。

此时， $\rho^A=tr_R(\rho^{AR})=\sum_{i,j}\sqrt{p_ip_j}|i\rang\lang j|tr(|i^R\rang\lang j^R|)=\sum_i p_i|i\rang\lang i|$ 。此时我们说， $|\psi\rang$ 是 $\rho^A$ 的纯化。有时记 $|\psi\rang=|AR\rang$ 。
Schmidt 分解和纯化的关系：子系统 A 混合态标准正交分解 $\rho^A=\sum_i p_i|i\rang\lang i|$ 纯化时会定义一个纯态 $|\psi\rang$ ，而纯态 $|\psi\rang$ 在 Schmidt 分解时 $|\psi\rang=\sum_{i,j}a_{ij}|i\rang\otimes|j\rang$ 系统 A 部分的 $|i\rang$ 也正好可以把 $\rho^A$ 对角化，即是其标准正交分解的基 $|i\rang$ 。并且 Schmidt 系数是 $|\psi\rang\lang\psi|$ 的本征值的平方根。
对于一个复合系统状态 $|\psi\rang$ 对其 Schmidt 分解操作是：
- 计算 $\rho^{A}=tr_B(|\psi\rang\lang\psi|)$ ，将 $\rho^A$ 对角化 $\rho^A=\sum_i\lambda_i|i\rang\lang i|$
- 计算 $\rho^B=tr_A(|\psi\rang\lang|\psi|)$ ，将 $\rho^B$ 对角化 $\rho^B=\sum_i\lambda_i|i'\rang\lang i'|$
- 得到结果 $|\psi\rang=\sum_i\sqrt{\lambda_i}|i'\rang|i\rang$

# Bell 不等式和 EPR 对

考虑在经典力学中，物体的物理属性是独立于测量的。例如静止网球的位置不会因为多次测量而改变。那么现在构造物体 A，B，它们分别有两个物理性质，A 的物理性质记为 P 和 Q，P 和 Q 在观测后只能得到结果为 + 1 或 - 1. 同样 B 有物理性质 S 和 T，测量结果也只能为 $\pm 1$ 。在现实生活中我们认为对不同物体的测量是独立的。而测量结果（对两个物体各两个性质测量，共四个结果）:

$QS+RS+RT-QT=(Q+R)S+(R-Q)T\leq 2\quad Q,R=\pm 1$

所以期望 $E(QS)+E(RS)+E(RT)-E(QT)=E(QS+RS+RT-QT)=\sum p(qs+rs+rt-qt)\leq \sum2p=2$

上式被称为 Bell 不等式或 CHSH 不等式。
但是在量子力学中，构造一个双量子比特状态 $|\psi\rang=\frac{|01\rang-|10\rang}{\sqrt{2}}$ ，将第一个量子比特给 Alice，第二个 Bob。同样根据现实我们可以认为 Alice 和 Bob 的测量是独立的。那么考虑下面可测量量：

$Q=Z_1,S=\frac{-Z_2-X_2}{\sqrt{2}}\\ R=X_1,T=\frac{Z_2-X_2}{\sqrt{2}}$

不难计算这些可测量量的本征值都是 $\pm 1$ 。那么对状态 $|\psi\rang$ 有：

$\lang QS\rang=\frac{1}{2}(\lang 01|-\lang 10|)Q\otimes S(|01\rang-|10\rang)=\frac{1}{\sqrt{2}}\\ \lang RS\rang=\lang RT\rang=\frac{1}{\sqrt{2}}\\ \lang QT\rang=-\frac{1}{\sqrt{2}}$

于是 $\lang QS\rang+\lang RS\rang+\lang RT\rang -\lang QT\rang=2\sqrt{2}$ 与经典力学中得出的 $\leq 2$ 矛盾！
某光子实验已经证明了自然不服从 Bell 不等式。

推导出 Bell 不等式的过程需要很多细微的假定，书上只总结了两个要点：

（1）物理性质有独立于观测的值。这称为实在性（reality）假定。

（2）Alice 的测量结果不影响 Bob 的测量结果。称为定域性（locality）假定。

这两个假定合称定域实在性假定。在直观上是有道理的，但是量子力学预言其中至少有一个是错误的。
EPR 实验中的反关联

考虑这样一个双量子比特状态 $|\psi\rang=\frac{|01\rang-|10\rang}{\sqrt{2}}$ ，不难看出它是一个纠缠态。

接下来考虑这样一个可测量量 $M=\overrightarrow{v}\cdot\overrightarrow{\sigma}$ ，其中 $\overrightarrow{v}$ 是一个三维单位向量。显然，对于任何单量子比特系统状态，M 的测量值一定是 $\pm1$ （即 M 的本征值，Ex2.35 结论）。记 $|a\rang,|b\rang$ 为 M 的两个本征矢（ $|a\rang$ 对应本征值 1， $|b\rang$ 对应 - 1），即有：

$|0\rang=\alpha|a\rang+\beta|b\rang\\ |1\rang=\gamma|a\rang+\delta|b\rang$

代入 $|\psi\rang$ ，有

$|\psi\rang=(\alpha\delta-\beta\gamma)\frac{|ab\rang-|ba\rang}{\sqrt{2}}$

下面证明 $|\alpha\delta-\beta\gamma|=1$ ：

$(\alpha\delta-\beta\gamma)|a\rang=\delta|0\rang-\beta|1\rang\\ (\beta\gamma-\alpha\delta)|b\rang=\gamma |0\rang-\alpha|1\rang\\$

两边同时取模：

$|\alpha\delta-\beta\gamma|^2=|\delta|^2+|\beta|^2=|\gamma|^2+|\alpha|^2$

又因为 $|\alpha|^2+|\beta|^2=1,|\gamma|^2+|\delta|^2=1\\$ ，两式相加 $|\delta|^2+|\beta|^2+|\gamma|^2+|\alpha|^2=2$ ，代入上连等式

$|\alpha\delta-\beta\gamma|^2=|\delta|^2+|\beta|^2=|\gamma|^2+|\alpha|^2=1$

所以事实上， $\alpha\delta-\beta\gamma=e^{i\theta}$ ，对于某个实数 $\theta$ 。故

$\frac{|01\rang-|10\rang}{\sqrt{2}}=|\psi\rang=e^{i\theta}\frac{|ab\rang-|ba\rang}{\sqrt{2}}$

差了一个全局相位，所以在测量上， $\frac{|01\rang-|10\rang}{\sqrt{2}}$ 和 $\frac{|ab\rang-|ba\rang}{\sqrt{2}}$ 没有区别。故此时考虑可测量量 $M$ 的投影测量，状态 $\frac{|ab\rang-|ba\rang}{\sqrt{2}}$ 第一量子比特分别以概率 $\frac{1}{2}$ 得到结果 1，-1. 但如果第一量子比特得到结果 1，系统将进入 $|\psi'\rang=|b\rang$ 状态，此时第二量子比特测量结果必为 - 1. 同样，若第一量子比特得到结果 - 1，则系统进入 $|\psi'\rang=|a\rang$ 状态，此时第二量子比特测量结果必为 1.

而状态 $\frac{|01\rang-|10\rang}{\sqrt{2}}$ 也有这样的性质，这称为 EPR 实验中的反关联。