物理光学10 相干光与相干性

    • 相干性的概念
      • 相干程度
      • 干涉条纹清晰度
    • 空间相干性
      • van Cittert-Zernike定理
    • 时间相干性

在第六讲介绍干涉的基本原理时,我们提到了coherent light(同调光或者相干光)的概念,如果两列光的初始相位差为0,就称这两列光是相干光,这是它们能干涉的必要条件。这一讲我们深入讨论相干光的性质。


相干性的概念

考虑从光源S1,S2S_1,S_2S1,S2发出的两列光:
E⃗1=E⃗10ei(k⃗1⋅r⃗1−wt+ϕ1)E⃗2=E⃗20ei(k⃗2⋅r⃗2−wt+ϕ2)\vec E_1 = \vec E_{10}e^{i(\vec k_1 \cdot \vec r_1-wt+\phi_1)} \\ \vec E_2 = \vec E_{20} e^{i(\vec k_2 \cdot \vec r_2 – wt+\phi_2)}E1=E10ei(k1r1wt+ϕ1)E2=E20ei(k2r2wt+ϕ2)

其中PPP是观察者的位置,r⃗1=S1P→,r2=S2P→\vec r_1 = \overrightarrow{S_1P},r_2=\overrightarrow{S_2P}r1=S1P,r2=S2P,在PPP点处观察到的光的强度为
I=⟨∣E⃗1+E⃗2∣2⟩T=⟨∣E⃗1∣2⟩T⏟I1+⟨∣E⃗2∣2⟩T⏟I2+2Re⟨E⃗1⋅E⃗2∗⟩T⏟interferenceI= \langle |\vec E_1+\vec E_2|^2 \rangle_T=\underbrace{\langle |\vec E_1|^2 \rangle_T}_{I_1}+\underbrace{\langle |\vec E_2|^2 \rangle_T}_{I_2}+\underbrace{2Re \langle \vec E_1 \cdot \vec E_2^* \rangle_T}_{interference}I=E1+E22T=I1E12T+I2E22T+interference2ReE1E2T

⟨⋅⟩T\langle \cdot \rangle_TT表示某个物理量在一段时间内的平均值:
⟨f(t)⟩T=lim⁡T→∞1T∫0Tf(t)dt\langle f(t) \rangle_T = \lim_{T \to \infty} \frac{1}{T}\int_0^T f(t)dtf(t)T=TlimT10Tf(t)dt

记干涉项为
Γ12=2Re⟨E⃗1⋅E⃗2∗⟩T\Gamma_{12}=2Re \langle \vec E_1 \cdot \vec E_2^* \rangle_TΓ12=2ReE1E2T如果干涉项非零,就称这两列光满足mutual coherence(相干),在stationary system中,场随时间的变化与起点无关,只与相对时间有关,如果S2S_2S2发出的光比S1S_1S1发出的光晚,则
Γ12(τ)=lim⁡T→∞1T∫0TE⃗1(t)E⃗2(t+τ)dt\Gamma_{12}(\tau)=\lim_{T \to \infty} \frac{1}{T} \int_0^T \vec E_1(t)\vec E_2(t+\tau)dtΓ12(τ)=TlimT10TE1(t)E2(t+τ)dt

L2L_2L2空间中,上面的积分就是这两列光的mutual correlation function,另外,也可以定义self correlation function,
Γ11(τ)=lim⁡T→∞1T∫0TE⃗1(t)E⃗1(t+τ)dt\Gamma_{11}(\tau)=\lim_{T \to \infty} \frac{1}{T} \int_0^T \vec E_1(t)\vec E_1(t+\tau)dtΓ11(τ)=TlimT10TE1(t)E1(t+τ)dt

显然
Γ11(0)=I1,Γ22(0)=I2\Gamma_{11}(0)=I_1,\Gamma_{22}(0)=I_2Γ11(0)=I1,Γ22(0)=I2

相干程度

相干性只能保证两列光可以发生干涉,但是想要观察到明暗分明的干涉条纹,我们需要质量比较好的干涉,根据干涉项与光强的关系,定义degree of coherence(相干程度)来衡量干涉的质量:
γ12(τ)=Γ12(τ)Γ11(0)Γ22(0)\gamma_{12}(\tau)=\frac{\Gamma_{12}(\tau)}{\sqrt{\Gamma_{11}(0)\Gamma_{22}(0)}}γ12(τ)=Γ11(0)Γ22(0)Γ12(τ)

于是PPP点处的光强为
I(τ)=I1+I2+2I1I2Re[γ12(τ)]=I1+I2+2I1I2∣γ12(τ)∣cos⁡(ϕ12)I(\tau)=I_1+I_2+2\sqrt{I_1I_2}Re[\gamma_{12}(\tau)] \\ = I_1+I_2+2\sqrt{I_1I_2}|\gamma_{12}(\tau)|\cos(\phi_{12})I(τ)=I1+I2+2I1I2Re[γ12(τ)]=I1+I2+2I1I2γ12(τ)cos(ϕ12)

第二个等式把γ12(τ)\gamma_{12}(\tau)γ12(τ)分解为幅度和幅角γ12(τ)=∣γ12(τ)∣eiϕ12\gamma_{12}(\tau)=|\gamma_{12}(\tau)|e^{i\phi_{12}}γ12(τ)=γ12(τ)eiϕ12代入即可得到,其中幅角ϕ12\phi_{12}ϕ12代表相位差,它由两列光的光程差决定,与PPP的位置有关,决定明暗干涉条纹的分布;而幅度∣γ12(τ)∣|\gamma_{12}(\tau)|γ12(τ)则决定了两列光干涉明暗条纹区别是否明显,如果∣γ12(τ)∣=1|\gamma_{12}(\tau)|=1γ12(τ)=1,称这两列光complete coherence(完全同调或者完全相干),如果∣γ12(τ)∣=0|\gamma_{12}(\tau)|=0γ12(τ)=0,称这两列光complete incoherence(完全不相干),如果∣γ12(τ)∣∈(0,1)|\gamma_{12}(\tau)| \in (0,1)γ12(τ)(0,1),称这两列光partial coherence(部分相干),自然界中的光几乎都是部分相干的。

干涉条纹清晰度

定义干涉条纹的清晰度(fringe visibility)为
v=Imax−IminImax+Imin=2I1I2I1+I2∣γ12(τ)∣v=\frac{I_{max}-I_{min}}{I_{max}+I_{min}}=\frac{2\sqrt{I_1I_2}}{I_1+I_2}|\gamma_{12}(\tau)|v=Imax+IminImaxImin=I1+I22I1I2γ12(τ)

vvv是0到1之间的一个数,vvv越大代表明暗条纹亮度差别越大,干涉条纹也就越明显,这个量在实验光学中有重要意义:

  1. 在干涉实验中,vvv可以通过对明暗条纹的亮度测量得到,而∣γ12(τ)∣|\gamma_{12}(\tau)|γ12(τ)是更难计算的,但根据上述公式,通过vvv可以用干涉实验间接测量∣γ12(τ)∣=v(I1+I2)2I1I2|\gamma_{12}(\tau)|=\frac{v(I_1+I_2)}{2\sqrt{I_1I_2}}γ12(τ)=2I1I2v(I1+I2)
  2. I1=I2I_1=I_2I1=I2时,vvv取最大值∣γ12(τ)∣|\gamma_{12}(\tau)|γ12(τ),所以在干涉实验中,要尽量让两列相干光强度相同

空间相干性

下面讨论影响∣γ12(τ)∣|\gamma_{12}(\tau)|γ12(τ)S1,S2S_1,S_2S1,S2相对位置的关系,专业术语叫做spatial coherence。在理论模型中S1,S2S_1,S_2S1,S2都是点光源,点光源是没有大小的理想模型,但在光学建模中,我们需要考虑S1,S2S_1,S_2S1,S2的形状与大小。下面我们用双缝干涉的模型做一点修正:

物理光学10 相干光与相干性-编程之家

假设PPP点离zzz轴的距离为xxx,光源上某一点离zzz轴的距离为ξ\xiξ,我们可以把光源上的每一点都看成是一个点光源,那么根据杨氏双缝干涉的公式,经过Q1,Q2Q_1,Q_2Q1,Q2(假设∣Q1Q2∣=d|Q_1Q_2|=dQ1Q2=d)分光后到达PPP点的两列光光程差为(需要假设L,rS>>dL,r_S>>dL,rS>>d
δ≈kd(xL+ξrS)\delta \approx kd(\frac{x}{L}+\frac{\xi}{r_S})δkd(Lx+rSξ)

这个点光源在PPP点处产生的光强为
dI(ξ)=I1+I2+2I1I2cos⁡(δ)dI(\xi)=I_1+I_2+2\sqrt{I_1I_2}\cos(\delta)dI(ξ)=I1+I2+2I1I2cos(δ)

于是这个光源在PPP点处产生的光强等于所有点光源的积分:I=∫−ΔS/2+ΔS/2dI(ξ)=ΔS[I1+I2+2I1I2sinc(dΔSλrS)cos⁡(kdxL)]I=\int_{-\Delta S/2}^{+\Delta S/2}dI(\xi) \\ = \Delta S \left[ I_1+I_2+2\sqrt{I_1I_2} sinc(\frac{d \Delta S}{\lambda r_S})\cos(\frac{kdx}{L}) \right]I=ΔS/2+ΔS/2dI(ξ)=ΔS[I1+I2+2I1I2sinc(λrSdΔS)cos(Lkdx)]

其中sinc(x)=sin⁡(πx)πxsinc(x)=\frac{\sin (\pi x)}{\pi x}sinc(x)=πxsin(πx);除了因子ΔS\Delta SΔS外,这个结果与杨氏双缝干涉相比只是多了sinc(dΔSλrS)sinc(\frac{d \Delta S}{\lambda r_S})sinc(λrSdΔS)这一项。考虑一种简单的情况,如果I1=I2I_1=I_2I1=I2,则
v=∣sinc(dΔSλrS)∣=∣γ12(τ)∣v=|sinc(\frac{d \Delta S}{\lambda r_S})|=|\gamma_{12}(\tau)|v=sinc(λrSdΔS)=γ12(τ)

这就可以衡量Q1,Q2Q_1,Q_2Q1,Q2分光后两列光的spatial coherence。

物理光学10 相干光与相干性-编程之家
比如如果要在地球上用太阳光做干涉实验,那么光源设计参数为ΔS=1.4×109m\Delta S=1.4 \times 10^9mΔS=1.4×109m(太阳直径),rS=1.5×1011mr_S=1.5 \times 10^{11}mrS=1.5×1011m(日地距离),于是需要双缝距离不超过lt=λ/θS≈50μml_t=\lambda/\theta_S \approx 50 \mu mlt=λ/θS50μm,当然这个例子只是粗略估计。

van Cittert-Zernike定理

van Cittert-Zernike定理给出了在已知光源设计参数时计算空间中任意两点的spatial coherence的方法。假设光源光强分布为I(ξ)I(\xi)I(ξ)ξ\xiξ表示在光源的坐标系中光源的位置,设计参数为ΔS,rS\Delta S,r_SΔS,rS,分光点为Q1,Q2Q_1,Q_2Q1,Q2,二者在分光坐标系中的位置为x1,x2x_1, x_2x1,x2,于是
γ12=∫ΔSI(ξ)ei2πλrS(x2−x1)dξ∫ΔSI(ξ)dξ\gamma_{12}=\frac{\int_{\Delta S} I(\xi)e^{i\frac{2\pi}{\lambda r_S}(x_2-x_1)}d\xi}{\int_{\Delta S}I(\xi)d \xi}γ12=ΔSI(ξ)dξΔSI(ξ)eiλrS2π(x2x1)dξ

其中分子就是光强分布从光源坐标系到分光坐标系的Fourier变换。

对于圆形的光源,circular(ξ/(w/2))circular(\xi/(w/2))circular(ξ/(w/2))www为光源直径,
γ12=(w/2)2J1(πwρ)wρ/2,ρ=r0λrS\gamma_{12}=(w/2)^2\frac{J_1(\pi w \rho)}{w \rho/2},\rho = \frac{r_0}{\lambda r_S}γ12=(w/2)2wρ/2J1(πwρ),ρ=λrSr0

于是
lt≈1.22λθSl_t \approx 1.22 \frac{\lambda }{\theta_S}lt1.22θSλ

时间相干性

考虑同一个光源发出的光,经过S1,S2S_1,S_2S1,S2两条不同的光路到达PPP后可能存在时间差,假设光源是quasi-monochromatic,
E⃗(t)=E⃗0e−iwteiϕ0(t)⏟initialphase\vec E(t) = \vec E_0 e^{-iwt}\underbrace{e^{i\phi_0(t)}}_{initial\ phase}E(t)=E0eiwtinitial phaseeiϕ0(t)


Γ12(τ)=⟨E⃗(t)E⃗∗(t+τ)⟩τ=I0eiwτ⟨ei[ϕ0(t)−ϕ0(t+τ)]⟩τγ12(τ)=⟨E⃗(t)E⃗∗(t+τ)⟩⟨E⃗2⟩=eiwτlim⁡T→∞1T∫0Tei[ϕ0(t)−ϕ0(t+τ)]dt\Gamma_{12}(\tau)=\langle \vec E(t)\vec E^*(t+\tau) \rangle_{\tau}= I_0e^{iw\tau} \langle e^{i[\phi_0(t)-\phi_0(t+\tau)]} \rangle_{\tau} \\ \gamma_{12}(\tau)=\frac{\langle \vec E(t)\vec E^*(t+\tau) \rangle}{\langle \vec E^2 \rangle} = e^{iw\tau} \lim_{T \to \infty} \frac{1}{T}\int_0^T e^{i[\phi_0(t)-\phi_0(t+\tau)]}dtΓ12(τ)=E(t)E(t+τ)τ=I0eiwτei[ϕ0(t)ϕ0(t+τ)]τγ12(τ)=E2E(t)E(t+τ)=eiwτTlimT10Tei[ϕ0(t)ϕ0(t+τ)]dt

所以相干程度是取决于初始相位的分布的。把quasi-monochromatic light source看成一系列点光源的集合,每一个点光源的电子发生跃迁时(跃迁时间为τ0\tau_0τ0)发光,初始相位受电子跃迁瞬间的自旋状态等因素影响是一个随机变量,因此对于quasi-monochromatic light source,在τ≤τ0\tau\le \tau_0ττ0(保证单频的条件)时发生干涉,
γ12(τ)=eiwτ(1−ττ0)\gamma_{12}(\tau)=e^{iw\tau}(1-\frac{\tau}{\tau_0})γ12(τ)=eiwτ(1τ0τ)

τ0\tau_0τ0为coherence time,称lc=cτ0l_c=c\tau_0lc=cτ0为coherence length,这是保证temporal coherence的最大光程差。

接下来讨论一下τ0\tau_0τ0与光源的关系,做Fourier变换
E⃗(ν)=∫−∞+∞E⃗(t)e−2πiνtdt=∫−τ0/2τ0/2E⃗0e−i2π(ν−ν0)tdt=E⃗0τ0sinc((ν−ν0)τ0)\vec E(\nu)=\int_{-\infty}^{+\infty} \vec E(t)e^{-2 \pi i \nu t}dt \\ = \int_{-\tau_0/2}^{\tau_0/2} \vec E_0 e^{-i2 \pi(\nu – \nu_0)t}dt=\vec E_0 \tau_0 sinc((\nu – \nu_0)\tau_0)E(ν)=+E(t)e2πiνtdt=τ0/2τ0/2E0ei2π(νν0)tdt=E0τ0sinc((νν0)τ0)

其中2πν0=w2 \pi \nu_0=w2πν0=w,Fourier变换的结果就是光源发光的频谱,而功率谱是
G(ν)=∣E⃗(ν)∣=E⃗02τ02sinc2((ν−ν0)τ0)G(\nu)=|\vec E(\nu)|=\vec E_0^2 \tau_0^2 sinc^2((\nu-\nu_0)\tau_0)G(ν)=E(ν)=E02τ02sinc2((νν0)τ0)

中心频率为ν0\nu_0ν0,频宽或者称为线宽(linewidth)为
Δν=1τ0\Delta \nu=\frac{1}{\tau_0}Δν=τ01

因此
lc=cτ0=cΔνl_c=c\tau_0 = \frac{c}{\Delta \nu}lc=cτ0=Δνc

也就是做temporal coherence时,coherence length取决于光源的频宽,频宽越小(也就是光源发出的光频率越接近单频),允许的光程差就能越大,实验的容错率也能更高。