吾生而有涯而学而无涯 以有涯而逐无涯 殆矣!

# 量子力学引论

# 线性代数基础

# 记号

1

# 线性算子与矩阵

  • 定义在空间 V 到空间 W 上的线性算子为对任一输入是线性的函数A:VWA:V\rightarrow W 满足:

    A(iaiψ)=iai(Aψ)A(\sum_ia_i|\psi\rang)=\sum_ia_i(A|\psi\rang)

    称 A 为线性算子。

  • 线性算子常用矩阵来表示。考虑线性算子A:VWA:V\rightarrow W

    v1,...,vn|v_1\rang,...,|v_n\rang 是空间VV 的一组基,w1,...,wm|w_1\rang,...,|w_m\rang 是空间WW 的一组基,若:

    AvjiAijwiA|v_j\rang\equiv\sum_iA_{ij}|w_i\rang

    AijA_{ij} 为 A 的一个矩阵表示。

    上式的意义为,把 A 作用于 V 中的每个基向量(此时 A 是抽象的算子而非矩阵),一定会得到 W 中的一个向量。而这个向量可以用 W 的基表示。将每个 V 中的基向量对应的 W 中的坐标放在一起,就可以精确地描述这个算子实际上进行了怎样的运算。

# Pauli 阵

I=(1001),X=(0110)Y=(0ii0),Z=(1001)I=\begin{pmatrix}1&0\\0&1\end{pmatrix},X=\begin{pmatrix}0&1\\1&0\end{pmatrix}\\ Y=\begin{pmatrix}0&-i\\i&0\end{pmatrix},Z=\begin{pmatrix}1&0\\0&-1\end{pmatrix}

# 内积

  • 内积定义为V×VCV\times V\rightarrow C 的函数,满足对任意v,wV|v\rang,|w\rang\in V

    • (v,iλiwi)=iλi(v,wi)(|v\rang,\sum_i\lambda_i|w_i\rang)=\sum_i\lambda_i(|v\rang,|w_i\rang)

    • (v,w)=(w,v)(|v\rang,|w\rang)=(|w\rang,|v\rang)^*

    • (v,v)0,(v,v)=0iffv=0(|v\rang,|v\rang)\geq 0,(|v\rang,|v\rang)=0\quad iff|v\rang=0

  • (iλivi,w)=iλi(vi,w)(\sum_i\lambda_i|v_i\rang,|w\rang)=\sum_i\lambda_i^*(|v_i\rang,|w\rang)

  • 范束定义为|||v\rang||=\sqrt{\lang v|v\rang},\lang i|j\rang=\delta_

  • Schmidt 正交化

    v1=w1vk+1=wk+1i=1kviwk+1viwk+1i=1kviwk+1vi|v_1\rang=|w_1\rang\\ |v_{k+1}\rang=\frac{|w_{k+1}\rang-\sum_{i=1}^k\lang v_i|w_{k+1}\rang|v_i\rang}{|||w_{k+1}\rang-\sum_{i=1}^k\lang v_i|w_{k+1}\rang|v_i\rang||}

# 外积

  • vV,wW,|v\rang\in V,|w\rang\in W, 外积wv|w\rang\lang v| 定义为VWV\rightarrow W 的算子,满足:

    (wv)v=vvw(|w\rang\lang v|)|v'\rang=\lang v|v'\rang|w\rang

  • vi|v_i\rang 为空间VV 的一组标准正交基,有:

    vV,i(vivi)v=ivivvi=v(vi上的投影为viv)\forall |v\rang\in V,\sum_i(|v_i\rang\lang v_i|)|v\rang=\sum_i\lang v_i|v\rang|v_i\rang=|v\rang(|v\rang在|i\rang上的投影为\lang v_i|v\rang)

    所以,iii=I\sum_i|i\rang\lang i|=I

  • 对任意一个VWV\rightarrow W 的算子 A,它都可以表示成外积关系。

    A=IWAIV=i,jwjwjAvivi=i,jwjAviwjviA=I_WAI_V=\sum_{i,j}|w_j\rang\lang w_j|A|v_i\rang\lang v_i|\\ =\sum_{i,j}\lang w_j|A|v_i\rang|w_j\rang\lang v_i|

    所以对于输入基vi|v_i\rang 和输出基wi|w_i\rang,A 的矩阵表示中Aji=wjAviA_{ji}=\lang w_j|A|v_i\rang

  • Cauchy-Schwarz 不等式

    vw2vvww|\lang v|w\rang|^2\leq\lang v|v\rang\lang w|w\rang

# 特征值与特征向量

  • 若矩阵 A 是酉相似与对角阵,则它是酉可对角化的。即:

    A=U1diag{λ1,...,λn}U,其中,UU=UU=I,A=iλiλ=iλ=i若A=U^{-1}diag\{\lambda_1,...,\lambda_n\}U,其中,U^\intercal U=U^\intercal U=I,则A=\sum_i\lambda_i|\lambda=i\rang\lang\lambda=i|

# Hermite 算子与伴随

  • 设 A 是空间VV 上的线性算子,则存在且只存在一个空间VV 上的算子AA^\intercal 使得:

    v,wV,(v,Aw)=(Av,w)\forall |v\rang,|w\rang\in V,(|v\rang,A|w\rang)=(A^\intercal|v\rang,|w\rang)

  • (AB)=BA,(v)=vA=(A)T(AB)^\intercal = B^\intercal A^\intercal,(|v\rang)^\intercal=\lang v|\\ A^\intercal = (A^*)^T

  • WW 是 d 维空间VV 的 k 维子空间,且v1,...,vk|v_1\rang,...,|v_k\rangWW 的一组标准正交基,定义:

    Pi=1kvkvkP\equiv\sum_{i=1}^k|v_k\rang\lang v_k|

    则 P 是 Hermite 的,即P=PP^\intercal = P。我们称 P 为 “到空间 W 上的投影算子”,它的意义是,对于任意一个 V 中的向量v|v\rangPv=i=1kvkvvkP|v\rang=\sum_{i=1}^k\lang v_k|v\rang|v_k\rang,其实就把v|v\rang 分解到 W 的基上,从而去除和 W 正交的分量。(和数学中定义幂等算子为投影算子不等价!)

    P 的正交补算子QIPQ\equiv I-P 就是把向量投影到补空间上。显然(P+Q)v=v(P+Q)|v\rang=|v\rang

  • 投影算子满足P2=PP^2=P,但反之不成立!

  • 矩阵 A 是正规的当且仅当AA=AAA^\intercal A=AA^\intercal。矩阵 A 可酉对角化(酉相似于对角阵,可对角化)当且仅当 A 是正规矩阵。(谱分解定理)

  • 正规矩阵是 Hermite 的当且仅当它的特征值全为实数。

  • 矩阵 A 是的当且仅当AA=IA^\intercal A=I

    酉矩阵保持内积(Uv,Uw)=(Uv)(Uw)=vUUw=vw(U|v\rang,U|w\rang)=(U|v\rang)^\intercal(U|w\rang)=\lang v|U^\intercal U|w\rang=\lang v|w\rang

    因此,酉算子有很好的性质:

    vi|v_i\rang 为一组标准正交基,则定义wiUvi|w_i\rang\equiv U|v_i\rang 也为一组标准正交基,且U=wiviU=\sum|w_i\rang\lang v_i|

    反之,若wi,vi|w_i\rang,|v_i\rang 都为标准正交基,则wivi\sum|w_i\rang\lang v_i| 是酉的。

  • 酉矩阵所有特征值模均为一。即λeiθ\lambda\equiv e^{i\theta},Pauli 矩阵都是 Hermite 和酉的。

  • 正定和半正定算子,即考量vAv\lang v|A|v\rang 是否恒大于(大于等于)零。

# 张量积

  • i|i\rangVV 的一组标准正交基,j|j\rangWW 的一组标准正交基,则ij|i\rang\otimes|j\rang 为空间VWV\otimes W (nm 维) 的一组标准正交基。

  • 张量积满足:

    • z(vw)=zvzwz(|v\rang\otimes|w\rang)=z|v\rang\otimes z|w\rang

    • (v+w)u=vu+wu(|v\rang+|w\rang)\otimes|u\rang=|v\rang\otimes|u\rang+|w\rang\otimes|u\rang

    • u(v+w)=uv+uw|u\rang\otimes(|v\rang+|w\rang)=|u\rang\otimes|v\rang+|u\rang\otimes|w\rang

  • 由此,可以定义定义在VWV\otimes W 上的线性算子ABA\otimes B 满足:

    (AB)(vw)=AvBw(A\otimes B)(|v\rang\otimes|w\rang)=A|v\rang\otimes B|w\rang

    (有点类似同构映射保持运算的意思。)

  • 同样,可以定义VWV\otimes W 上的自然内积为:

    (v1w1,v2w2)=v1v2w1w2(iaiviwi,jbjvjwj)=i,jaibjvivjwiwj(|v_1\rang\otimes|w_1\rang,|v_2\rang\otimes|w_2\rang)=\lang v_1|v_2\rang\lang w_1|w_2\rang\\ (\sum_ia_i|v_i\rang\otimes|w_i\rang,\sum_jb_j|v_j'\rang\otimes |w_j'\rang)=\sum_{i,j}a_i^*b_j\lang v_i|v_j'\rang\lang w_i|w_j'\rang

  • 一个具体的张量积:Kronecker 积

    Am×nBp×q=(A11BA12B...A1nB............Am1BAm2...AmnB)mp×nqA_{m\times n}\otimes B_{p\times q}=\begin{pmatrix}A_{11}B&A_{12}B&...&A_{1n}B\\ ...&...&...&...\\A_{m1}B&A_{m2}&...&A_{mn}B\end{pmatrix}_{mp\times nq}

  • 张量积对一些运算是分配的:

    (AB)=AB,(AB)T=ATBT,(AB)=AB(A\otimes B)^*=A^*\otimes B^*,(A\otimes B)^T=A^T\otimes B^T,(A\otimes B)^\intercal = A^\intercal\otimes B^\intercal

  • 两个酉算子张量积是酉的,两个 Hermite 张量积是 Hermite 的,两个半正定算子的张量积是半正定的,两个投影算子的张量积是投影算子。

# 算子函数

  • 算子函数定义在正规算子上。f(A)=f(λiii)=f(λi)iif(A)=f(\sum\lambda_i|i\rang\lang i|)=\sum f(\lambda_i)|i\rang\lang i|

  • 算子的迹定义为算子任意一个矩阵表示的对角线元素和。不难证明tr(AB)=tr(BA),tr(zA)=ztr(A)tr(AB)=tr(BA),tr(zA)=ztr(A),且矩阵的迹在酉相似下保持不变。故可定义为任意一个矩阵表示。

  • tr(Aψψ)=iAψψi=ψAψ,i=(0,0,...,1(i),...,0)Ttr(A|\psi\rang\lang\psi|)=\sum\lang i|A|\psi\rang\lang\psi|i\rang=\lang \psi|A|\psi\rang,|i\rang=(0,0,...,1(第i个),...,0)^T

# 对易式与反对易式

  • 对易式[A,B]ABBA[A,B]\equiv AB-BA,反对易式{A,B}=AB+BA\{A,B\}=AB+BA,若[A,B]=0[A,B]=0,则称 A,B 为对易的。

  • 同时对角化定理:设 A,B 是 Hermite 算子,当且仅当存在一个标准正交基,使得 A 和 B 在这个基下同时是可酉对角化的,则[A,B]=0[A,B]=0,在这种情况下,称 A,B 可同时对角化。

    可以验证A=Q1D1Q,B=Q1D2Q,QQ=I[A,B]=0,下面证明反过来的命题可以验证A=Q^{-1}D_1Q,B=Q^{-1}D_2Q,Q^\intercal Q=I\Rightarrow [A,B]=0,下面证明反过来的命题

    aj为本征值a的本征空间Va的一组标准正交基,有:ABaj=BAaj=aBajPa为到Va的投影算子,定义BaPaBPa,显然Ba的本征空间是Va的子空间(Pa(BPav)=bvvVa),且BaHermite于是BaVa的标准正交基下可谱分解,记这些本征矢为abj显然有Paabj=abj,Babj=PaBabj(BabjVa中的元素)所以有Babj=PaBPaabj=babj所以在abj,A,B可同时对角化记|a_j\rang为本征值a的本征空间V_a的一组标准正交基,有:\\ AB|a_j\rang=BA|a_j\rang=aB|a_j\rang\\ 令P_a为到V_a的投影算子,定义B_a\equiv P_aBP_a,显然B_a的本征空间是V_a 的子空间\\(P_a(BP_a|v\rang)=b|v\rang\Rightarrow |v\rang\in V_a)\\,且B_a是Hermite的\\ 于是B_a在V_a的标准正交基下可谱分解,记这些本征矢为|a_{b_j}\rang\\ 显然有P_a|a_{b_j}\rang=|a_{b_j}\rang,B|a_{b_j}\rang=P_aB|a_{b_j}\rang(B|a_{b_j}\rang是V_a中的元素)\\ 所以有B|a_{b_j}\rang=P_aBP_a|a_{b_j}\rang=b|a_{b_j}\rang\\ 所以在|a_{b_j}\rang下,A,B可同时对角化

  • AB=[A,B]+{A,B}2AB=\frac{[A,B]+\{A,B\}}{2}

# 极式分解和奇异值分解

  • 极式分解:令 A 是空间 V 上的线性算子,则存在酉算子 U 和半正定算子 J,K 满足:

    A=UJ=KU,其中JAA,KAA而且若A可逆,则U也唯一A=UJ=KU,其中J\equiv\sqrt{A^\intercal A},K\equiv\sqrt{AA^\intercal}\\ 而且若A可逆,则U也唯一

证明:

JAA是一个半正定算子,则其也是Hermite的,可进行谱分解J=iλiii定义ψiAi,ψiψi=λi2考虑λi0的本征矢,定义eiψi/λi,故ei是单位化的且对于ij,eiej=iAAjλiλj=iJ2jλiλj=λiλjijλiλj=0所以ei是标准正交的定义酉算子Uieii,下面证明算子U=算子Ai,λi0时,UJi=λiei=Aiλi=0时,UJi=0=Ai所以A=UJJ\equiv \sqrt{A^\intercal A}是一个半正定算子,则其也是Hermite的,可进行谱分解J=\sum_i\lambda_i| i\rang\lang i|\\ 定义|\psi_i\rang\equiv A|i\rang,有\lang\psi_i|\psi_i\rang=\lambda_i^2\\ 考虑\lambda_i\neq 0的本征矢,定义|e_i\rang\equiv|\psi_i\rang/\lambda_i,故|e_i\rang是单位化的\\ 且对于i\neq j,\lang e_i|e_j\rang=\frac{\lang i|A^\intercal A|j\rang}{\lambda_i\lambda_j}=\frac{\lang i|J^2|j\rang}{\lambda_i\lambda_j}=\frac{\lambda_i^*\lambda_j\lang i|j\rang}{\lambda_i\lambda_j}=0\\ 所以|e_i\rang是标准正交的\\ 定义酉算子U\equiv \sum_i|e_i\rang\lang i|,下面证明算子U=算子A\\ \forall |i\rang,\lambda_i\neq 0时,UJ|i\rang=\lambda_i|e_i\rang=A|i\rang\\ \lambda_i=0时,UJ|i\rang=0=A|i\rang\\ 所以A=UJ

下面证明J是唯一的.因为A=UJ,所以A=JU=JU乘在一起,AA=J2,J是固定唯一的关于右极式分解,A=UJUU=(UJU)U=KU,K也是半正定的。下面证明J是唯一的.\\ 因为A=UJ,所以A^\intercal = J^\intercal U^\intercal=JU^\intercal\\ 乘在一起,A^\intercal A=J^2,即J是固定唯一的\\ 关于右极式分解,A=UJU^\intercal U=(UJU^\intercal)U=KU,K也是半正定的。

  • 奇异值分解:令 A 是一方阵,则必存在酉矩阵 U,V 和一个非负对角阵 D,使得:

    A=UDVA=UDV

    简单证明:

    A=SJ(极值分解)J=TDT(J=AA酉相似于对角阵,T为酉矩阵)所以A=(ST)D(T)=UDVA=SJ(极值分解)\\ J=TDT^\intercal(J=\sqrt{A^\intercal A}酉相似于对角阵,T为酉矩阵)\\ 所以A=(ST)D(T^\intercal)=UDV

    其中 D 的对角元素称为 A 的奇异值。

# 量子力学假设

# 假设一:状态空间

  • 假设 1:任意一个孤立物理系统都有一个称为系统状态空间的复内积向量空间(即 Hilbert 空间)与之联系,系统完全由状态向量所描述,这个向量是系统状态空间的一个单位向量。

  • 例:一个量子比特的状态空间(二维)。状态空间中的任意状态向量可写作

    ψ=a0+b1,a,bC|\psi\rang=a|0\rang+b|1\rang,a,b\in C

    a2+b2=1|a|^2+|b|^2=1 常称为状态向量的归一化条件。

  • 任意线性组合iαiψi\sum_i\alpha_i|\psi_i\rang 理解为状态ψi|\psi_i\rang 具有幅度αi\alpha_i 的一个叠加。

# 假设二:演化

  • 假设 2:一个封闭量子系统的演化可以由一个酉变化来刻画。即系统在时刻t1t_1 的状态ψ1|\psi_1\rang 和在t2t_2 的状态ψ2|\psi_2\rang 可以通过一个仅依赖时间t1,t2t_1,t_2 的酉算子来联系:

    ψ2=U(t1,t2)ψ1,whereUU=UU=I|\psi_2\rang=U(t_1,t_2)|\psi_1\rang,where\quad U^\intercal U=UU^\intercal =I

  • Pauli 矩阵中 X 被称为比特翻转(bit flip)矩阵,Z 被称为相位翻转(phase flip)矩阵。

  • 假设 2‘:封闭量子系统的演化由薛定谔方程描述:

    idψdt=Hψi\hbar\frac{d|\psi\rang}{dt}=H|\psi\rang

    其中,HH 称为封闭系统 Hamilton 量固定 Hermite 算子,常用实验得出。

    而因为 H 是 Hermite 的,故有谱分解:

    H=EEEEH=\sum_E E|E\rang\lang E|

    其中,状态E|E\rang 习惯上称作能量本征态(energy eigenstate)或定态(stationary state),而EEE|E\rang 的能量。最小的 E 称为系统的基态能量(ground state energy),相应的能量本征态(或本征空间)称为基态(ground state)。

    * 状态E|E\rang 常被称作定态是因为它们随时间的变化只是一个数值因子:

    Eexp(iEt)E|E\rang\rightarrow exp(\frac{-iEt}{\hbar})|E\rang

  • 薛定谔方程的解:(2021-07-16by 武汉大学数学李平学姐)

    • 因为HH 是 Hermite 的,故酉相似于对角矩阵P^\intercal HP=P^{-1}HP=D=diag\
    • 又因为PP=IPP^\intercal=I,有iPdψdt=PH(PP)ψi\hbar P^\intercal \frac{d|\psi\rang}{dt}=P^\intercal H(PP^\intercal)|\psi\rang,即idPψdt=DPψi\hbar\frac{dP^\intercal |\psi\rang}{dt}=DP^\intercal|\psi\rang
    • ϕPψ|\phi\rang\equiv P^\intercal |\psi\rang,即有idϕdt=Dϕi\hbar\frac{d|\phi\rang}{dt}=D|\phi\rang,即线性微分方程组:idϕidt=diϕii\hbar\frac{d\phi_i}{dt}=d_i\phi_i
  • 解得,有ϕi=ϕi0eitdi\phi_i=\phi_{i0}e^{\frac{-itd_i}{\hbar}},其中ϕi0\phi_{i0}ϕi\phi_i 的初始值。写成矩阵形式,即ϕ=eitDϕ0|\phi\rang=e^{\frac{-itD}{\hbar}}|\phi_0\rang

    • ψ=Pϕ=PeitD(PP)ϕ0|\psi\rang=P|\phi\rang=Pe^{\frac{-itD}{\hbar}}(P^\intercal P)|\phi_0\rang
    • 3
    • 所以ψ=eitPDPPϕ0=eitHψ0|\psi\rang=e^{\frac{-itPDP^\intercal}{\hbar}}P|\phi_0\rang=e^{\frac{-itH}{\hbar}}|\psi_0\rang
  • 常有以下说法:

    “把一个酉算子应用到一个特定的量子系统上”(applying a unitary operator to a particular quantum system),量子系统在和 “我们” 相互作用后将不再封闭。但状态向量仍可以用另一个 Hamilton 量相近似。

# 假设三:量子测量

  • 假设 3:量子测量由一组测量算子{Mm}\{M_m\} 描述,这些算子作用在被测系统状态空间上,指标mm 表示实验中可能的测量结果。若在测量前,量子系统最新状态是ψ|\psi\rang,则结果mm 发生的可能性是:

    p(m)=ψMmMmψ=tr(ψψMmMm)p(m)=\lang\psi|M_m^\intercal M_m|\psi\rang=tr(|\psi\rang\lang\psi|M_m^\intercal M_m)

    且测量后系统的状态为:

    ψ=MmψψMmMmψ|\psi'\rang=\frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}}

    假设内容包括:测量算子MmM_m 满足完备性方程:mMmMm=I\sum_m M_m^\intercal M_m=I,因此:

    mp(m)=mtr(ψψMmMm)=tr(ψψmMmMm)=tr(ψψI)=ψIψ=1\sum_mp(m)=\sum_mtr(|\psi\rang\lang\psi|M_m^\intercal M_m)=tr(|\psi\rang\lang\psi|\sum_mM_m^\intercal M_m)=tr(|\psi\rang\lang\psi|I)=\lang\psi|I|\psi\rang=1

    • 我自己对 “quantum measurement operator” 的理解:

      MmM_m,其中,mm 表示实验结果。譬如一个系统有状态ψ1,ψ2|\psi_1\rang,|\psi_2\rang,测量这个系统这样一个实验的结果只有 2 种 (1, 2):

      • ψ1M1ψ1=1,ψ1M2ψ1=0\lang\psi_1|M_1|\psi_1\rang=1,\lang\psi_1|M_2|\psi_1\rang=0,我理解为:若系统状态为ψ1|\psi_1\rang,则测量结果一定为 1.

        ψ2M1ψ2=0.75,ψ2M2ψ2=0.25\lang\psi_2|M_1|\psi_2\rang=0.75,\lang\psi_2|M_2|\psi_2\rang=0.25,我理解为:若系统状态为ψ2|\psi_2\rang,则有 75% 的概率测量到结果 1,25% 概率测量到结果 2.

        因此,在这样的假设下,若不知道系统状态下进行测量,若测量到结果 1,则无法确定系统是哪个状态;但如果测量到结果 2,则确定系统状态为ψ2|\psi_2\rang

      • 但若ψ1M1ψ1=1,ψ1M2ψ1=0,ψ2M1ψ2=0,ψ2M2ψ2=1\lang\psi_1|M_1|\psi_1\rang=1,\lang\psi_1|M_2|\psi_1\rang=0,\lang\psi_2|M_1|\psi_2\rang=0,\lang\psi_2|M_2|\psi_2\rang=1,则发现系统状态与实验结果是一一对应的。即出现结果 2,可以肯定系统状态是ψ2|\psi_2\rang;出现结果 1,可以肯定系统状态是ψ1|\psi_1\rang

        若存在这样的测量实验(测量算子),则状态ψ1,ψ2|\psi_1\rang,|\psi_2\rang 是可区分的。

      • 特别地,还有一种情况。若系统只有两个状态,某个测量实验却有三个测量结果。如果状态为ψ1|\psi_1\rang,则测量结果一定为 1 或 2(至于是哪个不一定),如果状态为ψ2|\psi_2\rang,则测量结果一定为 3。显然这时ψ1,ψ2|\psi_1\rang,|\psi_2\rang 也是可区分的,也因为此时可以把M1M_1M2M_2 合并。所以我认为,如果两个状态是可区分的,则在合并测量算子后,只剩下和状态一一对应的测量算子。

  • 关于可测量量(Observable)为什么可以用一个矩阵表示:

    根据我的理解,在经典物理下,“测量” 就是

    系统状态测量结果系统状态\rightarrow测量结果的映射。即对于不同的系统状态可以得出不同的测量结果。

    在量子力学中,可以用线性空间中的矢量ψ|\psi\rang 表示系统状态,而量子力学一大假设是测量结果一定是可测量量的本征值,且对应此时测量结果的系统状态为属于此本征值的本征矢。

    所以我认为,将 “可测量量” 用一个形如M=λPλ=λλλM=\sum\lambda P_\lambda=\sum \lambda|\lambda\rang\lang\lambda| 的 Hermite 算子表示,其实就是,构造了一个测量算子,使得利用这个测量算子可以根据系统状态计算出各个结果出现的概率。

    也就是说,可测量量的算子表示正好代表了一个测量实验,而这个测量算子正好可以用于根据系统状态来推断不同测量结果的概率(系统状态测量结果系统状态\rightarrow测量结果的映射)。

    根据我的理解,对于任意一个系统状态A|A\rang,采用测量算子PλP_\lambda,则APλA\lang A|P_\lambda|A\rang 就是系统状态为A|A\rang 时,对其进行测量得到结果是λ\lambda 的概率(我认为是对系统进行测量!而不是对可测量量进行测量,可测量量只反映了可能的测量结果及其过程),特别地,若A|A\rang 正交于测量算子MM 的属于本征值λ\lambda 的本征空间,则概率为 0;否则概率为A|A\rangλ\lambda 的本征空间投影的模长平方。

    可测量量 = 对系统进行测量所有可能得到的结果以及系统状态信息的整合

# 证明非正交状态的不可区分:

  • 设状态ψ1,ψ2|\psi_1\rang,|\psi_2\rang 非正交。反设它们可区分,则存在测量算子M1,M2M_1,M_2,使得:

ψ1M1M1ψ1=1,ψ1M2M2ψ1=0ψ2M1M1ψ1=0,ψ2M2M2ψ2=1M1ψ1=1,M2ψ1=0M1ψ2=0,M2ψ2=1\lang\psi_1|M_1^\intercal M_1|\psi_1\rang=1,\lang\psi_1|M_2^\intercal M_2|\psi_1\rang=0\\ \lang\psi_2|M_1^\intercal M_1|\psi_1\rang=0,\lang\psi_2|M_2^\intercal M_2|\psi_2\rang=1\\ \Rightarrow ||M_1|\psi_1\rang||=1,||M_2|\psi_1\rang||=0\\ ||M_1|\psi_2\rang||=0,||M_2|\psi_2\rang||=1

  • 此时因为ψ1,ψ2|\psi_1\rang,|\psi_2\rang 不正交,则ψ2=αψ1+βψ|\psi_2\rang=\alpha|\psi_1\rang+\beta|\psi\rang,其中ψ1|\psi_1\rangψ|\psi\rang 正交,且α2+β2=1,β<1|\alpha|^2+|\beta|^2=1,|\beta|< 1

    又因为:

1=M2ψ2=αM2ψ1+βM2ψαM2ψ1+βM2ψ=βM2ψ1=||M_2|\psi_2\rang||=||\alpha M_2|\psi_1\rang+\beta M_2|\psi\rang||\leq\alpha||M_2|\psi_1\rang||+\beta||M_2|\psi\rang||=\beta||M_2|\psi\rang||\\

​ 而

M2ψ2ψM1M1ψ+ψM2M2ψ=1||M_2|\psi\rang||^2\leq\lang\psi|M_1^\intercal M_1|\psi\rang+\lang\psi|M_2^\intercal M_2|\psi\rang=1

​ 所以:

1=βM2ψβ<11=\beta||M_2|\psi\rang||\leq\beta<1

​ 矛盾,故证毕。

  • 其实本质在于ψ1|\psi_1\rangψ2|\psi_2\rang 上有分量,因此ψ2|\psi_2\rang 状态对应可能的测量结果,状态ψ1|\psi_1\rang 也一定会有一定概率产生这个结果,故不可区分。
物理含义 数学表象
Observable Hermitian operator
Possible values (实验可能的结果) Eigenvalues
States in which result is unambiguous Eigenvectors

注意最后一个,States in which result is unambiguous 表示系统在这个状态时,根据实验测量结果可以断定出系统的状态。根据我的理解,此时系统的状态与实验结果是一一对应的。而这样的状态只能是可观测量的本征矢量。

# 投影测量

  • 投影测量由被测量系统状态空间上的一个可观测量 Hermite 算子 M 描述,该可观测量具有谱分解:

    M=mmPmM=\sum_mmP_m

    其中,PmP_m 为到特征值 m 的本征空间的投影算子(λ=m|\lambda=m\rang 为该本征空间的一组标准正交基):

    Pm=λ=mλ=mP_m=\sum|\lambda=m\rang\lang\lambda=m|

    PmPm=PmP_m^\intercal P_m=P_m

    测量状态ψ|\psi\rang 时,得到结果 m 的概率为:

    p(m)=ψPmPmψ=ψPmψ其实本质是ψ在本征空间上投影的模长平方p(m)=Pmψ2p(m)=\lang\psi|P_m^\intercal P_m|\psi\rang=\lang\psi|P_m|\psi\rang\\ 其实本质是|\psi\rang 在本征空间上投影的模长平方p(m)=||P_m|\psi\rang||^2

    测量后,状态变为

    ψ=Pmψp(m)|\psi'\rang=\frac{P_m|\psi\rang}{\sqrt{p(m)}}

    显然,PmP_m 满足:

    mPmPm=mPm=I,Pm=Pm\sum_mP_m^\intercal P_m=\sum_mP_m=I,P_m^\intercal=P_m

  • 投影测量有很多很好的性质:

    • 测量结果期望

      E(m)=mmp(m)=mmψPmψ=ψmmPmψ=ψMψE(m)=\sum_mmp(m)=\sum_mm\lang\psi|P_m|\psi\rang=\lang\psi|\sum_mmP_m|\psi\rang=\lang\psi|M|\psi\rang

      通常记MψMψ=E(m)\lang M\rang\equiv \lang\psi|M|\psi\rang=E(m),方差[Δ(M)]2=M2M2[\Delta(M)]^2=\lang M^2\rang-\lang M\rang^2
  • Heisenberger 测不准原理

    不妨设A,BA,B 是 Hermite 矩阵,设ψABψ=x+iy\lang\psi|AB|\psi\rang=x+iy

    则有ψ[A,B]ψ=2iy,ψ{A,B}ψ=2x\lang\psi|[A,B]|\psi\rang=2iy,\lang\psi|\{A,B\}|\psi\rang=2x,所以有:

    ψ[A,B]ψ2+ψ{A,B}ψ2=4ψABψ2|\lang\psi|[A,B]|\psi\rang|^2+|\lang\psi|\{A,B\}|\psi\rang|^2=4|\lang\psi|AB|\psi\rang|^2

    又 Cauchy-Schwarz 不等式以及A,BA,B 是 Hermite 的

    ψABψ2ψA2ψψB2ψ|\lang\psi|AB|\psi\rang|^2\leq\lang\psi|A^2|\psi\rang\lang\psi|B^2|\psi\rang

    所以有

    ψ[A,B]ψ24ψA2ψψB2ψ|\lang\psi|[A,B]|\psi\rang|^2\leq 4\lang\psi|A^2|\psi\rang\lang\psi|B^2|\psi\rang

    此时,令A=CCI,B=DDIA=C-\lang C\rang I,B=D-\lang D\rang IC,DC,D 是两个可测量量的矩阵表示

    [A,B]=[C,D],ψA2ψ=ψC2ψ2CψCψ+C2=C2C2=(ΔC)2[A,B]=[C,D],\lang|\psi|A^2|\psi\rang=\lang\psi|C^2|\psi\rang-2\lang C\rang\lang\psi|C|\psi\rang+\lang C\rang ^2=\lang C^2\rang-\lang C\rang^2=(\Delta C)^2

    所以有:

    ΔCΔDψ[C,D]ψ2\Delta C\Delta D\geq\frac{|\lang\psi|[C,D]|\psi\rang|}{2}

    • 测不准原理的正确理解:制备具有相同状态ψ|\psi\rang 的大量量子系统,并对其中一部分以测量算子CC 去测量,另一部分以DD 去测量。则测量的结果(C,DC,D 的本征量)的标准差要满足上面不等式。

# POVM 测量

  • 对于一个一般测量算子MmM_m,定义半正定算子EmMmMmE_m\equiv M_m^\intercal M_m,则有mEm=I,p(m)=ψEmψ\sum_mE_m=I,p(m)=\lang\psi|E_m|\psi\rang。于是算子集合EmE_m 足以确定不同测量结果的概率,算子EmE_m 称为与测量相联系的 POVM 元,完整的集合{Em}\{E_m\} 称为一个 POVM。
  • 同样可以给出更自然的 POVM 定义:满足 (1) 每个算子EmE_m 是半正定的 (2)mEm=I\sum_mE_m=I 的算子集合{Em}\{E_m\} 是一个 POVM。(因为半正定性,也可以反求出Mm=EmM_m=\sqrt{E_m}
  • 投影测量的可重复性:(根据我的理解)如果投影算子PmP_m 包含足够的维数,则Pmψ=ψP_m|\psi\rang=|\psi\rang(投影无信息损失),此时ψPmψ=ψψ=1\lang\psi|P_m|\psi\rang=\lang\psi|\psi\rang=1, 所以有ψ=PmψψPmψ=ψ|\psi'\rang=\frac{P_m|\psi\rang}{\sqrt{\lang\psi|P_m|\psi\rang}}=|\psi\rang,即无论进行多少次投影测量都不会改变系统的状态。
  • 注意 POVM 测量并不等价于一般测量!对于一个一般测量{Mm}\{M_m\},可对应唯一一个 POVM:{Em=MmMm}\{E_m=M_m^\intercal M_m\},但是给出一个 POVM{Em}\{E_m\},你却不能直接得出一般测量{Mm=Em}\{M_m=\sqrt{E_m}\},因为只要Mm=UEm,UM_m=U\sqrt{E_m},U 是酉的就都满足MmMm=EmM_m^\intercal M_m=E_m。这也应证了 POVM 为什么用于 “只关心概率结果而不关心系统测量后的状态”,因为给出EmE_m 可以测出概率,但无法得出MmM_m 也就无法得到系统测量后进入的状态。
  • * 存在系统可能的状态集合以及一个 POVM,使得根据测量结果推断出的系统状态不会出错,但是这是以有时候无法判断为代价。

# 相位(phase)

  • 全局相位因子:eiθe^{i\theta},状态eiθψe^{i\theta}|\psi\rangψ|\psi\rang 在统计意义上是相同的。因为ψeiθMMeiθψ=ψMMψ\lang\psi|e^{-i\theta}M^\intercal Me^{i\theta}|\psi\rang=\lang\psi|M^\intercal M|\psi\rang

  • 相对相位:如果两个模长相同的幅度 a,b 满足a=eiθba=e^{i\theta}b,则我们说幅度 a,b 差了一个相对相位。

    特别地,若两个状态ψ1,ψ2|\psi_1\rang,|\psi_2\rang 在这同一组基下每个幅度都差了一个相对相位,则称这两个状态在这组基下差了一个相对相位。

    相对相位与全局相位不同之处在于相对相位需要依赖基的选择。在某个基下差了相对的相位的状态有物理统计差别,而差了全局相位的状态却没有。

# 假设四:复合系统

  • 假设 4:复合物理系统的状态空间是分物理系统状态空间的张量积,若将分系统编号为 1 到 n,系统 i 的状态为ψi|\psi_i\rang,则系统的总状态为ψ1...ψn|\psi_1\rang\otimes...\otimes|\psi_n\rang

  • 一个算不上推导的解释:为什么选择张量积来描述联合系统的状态?

    由叠加性原理:若x,y|x\rang,|y\rang 是系统的两个状态,则它们的任意叠加αx+βy\alpha|x\rang+\beta|y\rang 也应该是系统的一个状态,其中α2+β2=1|\alpha|^2+|\beta|^2=1

    考虑系统 A 的一个状态v|v\rang,系统 B 的两个状态w1,w2|w_1\rang,|w_2\rang,系统 AB 的两个状态vw1,vw2|v\rang\otimes|w_1\rang,|v\rang\otimes|w_2\rang,则显然对于任意α2+β2=1|\alpha|^2+|\beta|^2=1,都有α(vw1)+β(vw2)=v(αw1βw2)\alpha(|v\rang\otimes|w_1\rang)+\beta(|v\rang\otimes|w_2\rang)=|v\rang\otimes(\alpha|w_1\rang\otimes\beta|w_2\rang),其中v,αw1βw2|v\rang,\alpha|w_1\rang\otimes\beta|w_2\rang 分别是系统 A,B 的状态,所以α(vw1)+β(v+w2)\alpha(|v\rang\otimes|w_1\rang)+\beta(|v\rang+|w_2\rang) 也是联合系统 AB 的状态。

    其实我认为满足这样性质的运算有很多,方便选了张量积。

  • 关于一个投影测量加上一个酉算子就可以实现一般测量:

    设有一个状态空间为 Q 的量子系统,希望在系统 Q 上进行由算子MmM_m 定义的测量。

    引入一个辅助系统,其状态空间为 M。该系统有一个与测量结果一一对应的标准正交基m|m\rang(即mMmMmmm==m?1:0\lang m'|M_m^\intercal M_m|m'\rang\equiv m==m'?1:0)。

    设 M 有一个状态为0|0\rang,对于 Q 中所有状态ψ|\psi\rang,在ψ0|\psi\rang\otimes|0\rang 上定义酉算子 U:

    U(ψ0)m(Mmψ)mU(|\psi\rang\otimes|0\rang)\equiv\sum_m (M_m|\psi\rang)\otimes|m\rang

    因此有:

    (U(ψ10),U(ψ20))=m,m((Mmψ1)m)((Mmψ2)m)=m,m((ψ1Mm)m)((Mmψ2)m)=m,mψ1MmMmψ2mm=ψ1mMmMmψ2=ψ1ψ2(U(|\psi_1\rang\otimes |0\rang),U(|\psi_2\rang\otimes|0\rang))=\sum_{m,m'}((M_m|\psi_1\rang)\otimes|m\rang)^\intercal((M_{m'}|\psi_2\rang)\otimes|m'\rang)\\ =\sum_{m,m'}((\lang\psi_1|M_m^\intercal)\otimes\lang m|)((M_{m'}|\psi_2\rang)\otimes|m'\rang)\\ =\sum_{m,m'}\lang\psi_1|M_m^\intercal M_{m'}|\psi_2\rang\lang m|m'\rang=\lang\psi_1|\sum_mM_m^\intercal M_m|\psi_2\rang=\lang\psi_1|\psi_2\rang

    可以发现如此定义的酉算子U:Span{ψ0}QMU:Span\{|\psi\rang\otimes|0\rang\}\rightarrow Q\otimes M 是保持内积的。

    Ex2.67,存在一个扩张到酉算子U:QMQMU':Q\otimes M\rightarrow Q\otimes M,使得wSpan{ψ0},UwUw\forall |w\rang \in Span\{|\psi\rang\otimes|0\rang\},U'|w\rang\equiv U|w\rang (证明在下面)

    UU' 作用于ψ0|\psi\rang\otimes|0\rang,考虑对复合系统的投影测量算子Pm=IQ(mm)P_m=I_Q\otimes(|m\rang\lang m|)

    p(m)=m,m[(ψMm)m][IQmm][(Mmψ)m]=m,mψMmIQMmψ[mmmm]=ψMmMmψp(m)=\sum_{m',m''}[(\lang\psi|M_{m'}^\intercal)\otimes\lang m'|]\cdot[I_Q\otimes|m\rang\lang m|]\cdot[(M_{m''}|\psi\rang)\otimes|m''\rang]\\ =\sum_{m',m''}\lang\psi|M_{m'}^\intercal I_QM_{m''}|\psi\rang\cdot[\lang m'|m\rang\lang m|m''\rang]\\ =\lang\psi|M_m^\intercal M_m|\psi\rang

    测量后系统状态变为:

    PmU(ψ0)p(m)=MmψψMmMmψm\frac{P_mU(|\psi\rang\otimes|0\rang)}{\sqrt{p(m)}}=\frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}}\otimes |m\rang

    其中,M 系统状态m|m\rang 被测量不会发生变化,而 Q 系统状态变为MmψψMmMmψ\frac{M_m|\psi\rang}{\sqrt{\lang\psi|M_m^\intercal M_m|\psi\rang}},就此借用酉算子 + 引入辅助系统实现了对 Q 系统的一般测量。

    • 关于 Ex2.67*“设 V 是 Hilbert 空间且 W 是其子空间。设U:WVU:W\rightarrow V 是一个保持内积的线性算子,即w1,w2W,w1UUw2=w1w2\forall |w_1\rang,|w_2\rang \in W,\lang w_1|U^\intercal U|w_2\rang=\lang w_1|w_2\rang。求证存在 U 的扩张算子U:VVU':V\rightarrow V,使得UwUwU'|w\rang\equiv U|w\rang。”*

      2

  • 其实复合系统状态记号很多样。根据我的理解vw=vw=vw|vw\rang=|v\rang|w\rang=|v\rang\otimes|w\rang

# 纠缠

  • 考虑双量子比特系统状态ψ=00+112|\psi\rang=\frac{|00\rang+|11\rang}{\sqrt2},它并不能表示为两个单量子比特系统状态的(张量)积。复合系统这种独特的状态称为纠缠态(entangled state),起因尚不明确。

# 总览

  • 假设 1 说明了如何描述一个孤立的量子系统的状态;假设 2 说明封闭量子系统的动态由薛定谔方程,也就是酉演化来描述;假设 3 说明了如何通过规定测量的描述来从量子系统获取信息;假设 4 说明如何将不同的量子系统合成复合系统。
  • 量子力学不同于传统经典力学在于无法直接观察系统的状态向量。因此诸如位置,能量,速率等经典力学里可以直接观测的量在量子力学中将变得不再基本。量子系统好像一个隐藏和封闭的世界,每次观测都将引起状态的改变。

# 初等量子力学的一个应用:超密编码

  • 问题:Alice 要给 Bob 传输一份两个经典比特的信息 (00, 01, 10, 11),但却只被允许发送一个量子比特。

  • 首先,Alice 和 Bob 共享一对纠缠态的量子比特ψ=00+112|\psi\rang=\frac{|00\rang+|11\rang}{\sqrt2},Alice 拥有第一个量子比特,Bob 拥有第二个量子比特。

    • 若想传输 00,Alice 作用 I 于第一量子比特上:ψ=I1ψ=00+112|\psi'\rang=I_1|\psi\rang=\frac{|00\rang+|11\rang}{\sqrt{2}}

    • 若想传输 01,Alice 作用 Z 于第一量子比特上:ψ=Z1ψ=00112|\psi'\rang=Z_1|\psi\rang=\frac{|00\rang-|11\rang}{\sqrt{2}}

    • 若想传输 10,Alice 作用 X 于第一量子比特上:ψ=X1ψ=10+012|\psi'\rang=X_1|\psi\rang=\frac{|10\rang+|01\rang}{\sqrt{2}}

    • 若想传输 11,Alice 作用 iY 于第一量子比特上:ψ=iY1ψ=10+012|\psi'\rang=iY_1|\psi\rang=\frac{-|10\rang+|01\rang}{\sqrt{2}}

  • 作用后得到的四个状态称为 Bell 态(或 Bell 基,EPR 对)不难验证它们是正交的。因此在 Alice 将第一个量子比特发送给 Bob 后,Bob 可以通过测量实验可靠区分这四种状态,即得到了传输的信息。事实上,传输信息的过程 Alice 永远不需要和第二个量子比特打交道。

  • 特别地,若有人劫持了 Alice 发的第一个量子比特,由于对于任意测量算子MmM_mψMmMmIψ\lang\psi|M_m^\intercal M_m\otimes I|\psi\rang 结果都一样,则劫持者也无法只通过第一个量子比特解密信息。


# 密度算子

  • 密度算子是一种数学上等价于状态向量的可以用来描述量子力学的工具。

# 量子状态的综述

  • 设量子系统以概率pip_i 处在一组状态{ψi}\{|\psi_i\rang\} 中的某一个,则称{pi,ψi}\{p_i,|\psi_i\rang\} 为一个纯态系综(ensemble of pure state),系统的密度算子(密度矩阵)定义为:

    ρipiψiψi\rho\equiv\sum_ip_i|\psi_i\rang\lang\psi_i|

  • 封闭量子系统的演化由酉算子来描述。系统初态为ψi|\psi_i\rang 的概率为pip_i,则演化发生后,系统会以概率pip_i 进入状态UψU|\psi_\rang。于是:

    ρ=ipiUψiψiU=UρU\rho'=\sum_ip_iU|\psi_i\rang\lang\psi_i|U^\intercal=U\rho U^\intercal

    观测算子MmM_m 测量系统时,

    p(m)=ip(测量结果为m系统状态为i)pi=iψiMmMmψipi=itr(MmMmψiψi)pi=tr(MmMmρ)p(m)=\sum_ip(测量结果为m|系统状态为i)*p_i\\ =\sum_i\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i\\ =\sum_itr(M_m^\intercal M_m|\psi_i\rang\lang\psi_i|)p_i\\ =tr(M_m^\intercal M_m\rho)

    考虑测量后的状态:

    ψim=MmψiψiMmMmψi|\psi_i^m\rang=\frac{M_m|\psi_i\rang}{\sqrt{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang}}\\

    注意:ψim|\psi_i^m\rang 是得到结果为 m 之后的状态!因此在计算测量得到结果为 m 后的密度算子ρm\rho_m 时,应为:

    ρm=ip(系统状态为i得到测量结果m)ψimψim\rho_m=\sum_ip(系统状态为i|得到测量结果m)|\psi_i^m\rang\lang\psi_i^m|\\

    由概率论基本原理,有:p(im)=p(im)p(m)=p(mi)p(i)p(m)=ψiMmMmψipitr(MmMmρ)p(i|m)=\frac{p(im)}{p(m)}=\frac{p(m|i)p(i)}{p(m)}=\frac{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i}{tr(M_m^\intercal M_m\rho)},所以:

    ρm=iψiMmMmψipitr(MmMmρ)MmψiψiMmψiMmMmψi=MmρMmtr(MmMmρ)\rho_m=\sum_i\frac{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang p_i}{tr(M_m^\intercal M_m\rho)}\cdot \frac{M_m|\psi_i\rang\lang\psi_i|M_m^\intercal}{\lang\psi_i|M_m^\intercal M_m|\psi_i\rang}=\frac{M_m\rho M_m^\intercal}{tr(M_m^\intercal M_m\rho)}

  • 处于某一个精确已知状态的量子系统称为处于纯态(pure state)。在这种情况下,ρ=ψψ\rho=|\psi\rang\lang\psi|。否则,就处于混合态(mixed state),是在ρ\rho 的系综中不同纯态的混合.

    显然,对于一个纯态,tr(ρ2)=tr(ψψψψ)=ψψψψ=1tr(\rho^2)=tr(|\psi\rang\lang\psi|\psi\rang\lang\psi|)=\lang\psi|\psi\rang\lang\psi|\psi\rang=1, 而对于一个混合态,tr(ρ2)<1tr(\rho^2)<1. 有时人们用混合态表示纯态和混合态 (可以把纯态看作特殊的混合态).

  • 混合态密度算子计算:如果系统以概率pip_i 处于某混合态ρi\rho_i (注意这里不是纯态的系综了!), 则系统的密度算子为ρ=ipiρi\rho=\sum_i p_i\rho_i. 证明如下:

    不妨记ρi=jpijψijψij\rho_i=\sum_jp_{ij}|\psi_{ij}\rang\lang\psi_{ij}| 其中{pij,ψij}\{p_{ij},|\psi_{ij}\rang\}(i 固定) 是一个纯态的系综。则

    ρ=i,j(pipij)ψijψij=ipijpijψijψij=ipiρi\rho=\sum_{i,j}(p_i*p_{ij})|\psi_{ij}\rang\lang\psi_{ij}|=\sum_ip_i\sum_jp_{ij}|\psi_{ij}\rang\lang\psi_{ij}|=\sum_ip_i\rho_i

    ρ\rho 为具有概率pip_i 的状态ρi\rho_i 的混合.

  • 因此,可以考虑混合态测量后的进入的混合态:

    ρ=mp(m)ρm\rho'=\sum_mp(m)\rho_m

    其中,如果系统得到结果为 m, 则系统会进入状态ρm\rho_m. 即测量后系统以概率为p(m)p(m) 处于状态ρm\rho_m. 故测量后系统状态为:

    ρ=mp(m)ρm=mtr(MmMmρ)MmρMmtr(MmMmρ)=mMmρMm\rho'=\sum_mp(m)\rho_m=\sum_mtr(M_m^\intercal M_m\rho)\frac{M_m\rho M_m^\intercal}{tr(M_m^\intercal M_m\rho)}=\sum_mM_m\rho M_m^\intercal

# 密度算子的特征

  • 一个算子ρ\rho 是和某个系综{pi,ψi}\{p_i,|\psi_i\rang\} 相联系的密度算子,当且仅当:

    • tr(ρ)=1tr(\rho)=1
    • ρ\rho 是半正定的。

    证明如下:

    ρ\rho 是密度算子,有tr(ρ)=ipitr(ψiψi)=ipiψiIψi=ipi=1tr(\rho)=\sum_i p_itr(|\psi_i\rang\lang\psi_i|)=\sum_ip_i\lang\psi_i|I|\psi_i\rang=\sum_ip_i=1φρφ=ipiφψ20\lang\varphi|\rho|\varphi\rang=\sum_ip_i|\lang\varphi|\psi\rang|^2\geq 0

    反过来,因为ρ\rho 是半正定算子,有谱分解ρ=jλjjj\rho=\sum_j\lambda_j|j\rang\lang j|,其中λj\lambda_j 为非负特征值,j|j\rang 是正交的。又因为jλj=1\sum_j\lambda_j=1