物理光学10 相干光与相干性

物理 光学10 相干光与相干性

- 相干性的概念
- - 相干程度
  - 干涉条纹清晰度
- 空间相干性
- - van Cittert-Zernike定理
- 时间相干性

在第六讲介绍干涉的基本原理时，我们提到了coherent light（同调光或者相干光）的概念，如果两列光的初始相位差为0，就称这两列光是相干光，这是它们能干涉的必要条件。这一讲我们深入讨论相干光的性质。

相干性的概念

考虑从光源 $S_1,S_2$ 发出的两列光：
$E⃗1=E⃗10ei(k⃗1⋅r⃗1−wt+ϕ1)E⃗2=E⃗20ei(k⃗2⋅r⃗2−wt+ϕ2)\vec E_1 = \vec E_{10}e^{i(\vec k_1 \cdot \vec r_1-wt+\phi_1)} \\ \vec E_2 = \vec E_{20} e^{i(\vec k_2 \cdot \vec r_2 – wt+\phi_2)}$

其中 $P$ 是观察者的位置， $r⃗1=S1P→,r2=S2P→\vec r_1 = \overrightarrow{S_1P},r_2=\overrightarrow{S_2P}$ ，在 $P$ 点处观察到的光的强度为
$\langle |\vec E_1+\vec E_2|^2 \rangle_T=\underbrace{\langle |\vec E_1|^2 \rangle_T}_{I_1}+\underbrace{\langle |\vec E_2|^2 \rangle_T}_{I_2}+\underbrace{2Re \langle \vec E_1 \cdot \vec E_2^* \rangle_T}_{interference}$

注： $⟨⋅⟩T\langle \cdot \rangle_T$ 表示某个物理量在一段时间内的平均值：
$⟨f(t)⟩T=lim⁡T→∞1T∫0Tf(t)dt\langle f(t) \rangle_T = \lim_{T \to \infty} \frac{1}{T}\int_0^T f(t)dt$

记干涉项为
$Γ12=2Re⟨E⃗1⋅E⃗2∗⟩T\Gamma_{12}=2Re \langle \vec E_1 \cdot \vec E_2^* \rangle_T$ 如果干涉项非零，就称这两列光满足mutual coherence（相干），在stationary system中，场随时间的变化与起点无关，只与相对时间有关，如果 $S_2$ 发出的光比 $S_1$ 发出的光晚，则
$Γ12(τ)=lim⁡T→∞1T∫0TE⃗1(t)E⃗2(t+τ)dt\Gamma_{12}(\tau)=\lim_{T \to \infty} \frac{1}{T} \int_0^T \vec E_1(t)\vec E_2(t+\tau)dt$

在 $L_2$ 空间中，上面的积分就是这两列光的mutual correlation function，另外，也可以定义self correlation function，
$Γ11(τ)=lim⁡T→∞1T∫0TE⃗1(t)E⃗1(t+τ)dt\Gamma_{11}(\tau)=\lim_{T \to \infty} \frac{1}{T} \int_0^T \vec E_1(t)\vec E_1(t+\tau)dt$

显然
$Γ11(0)=I1,Γ22(0)=I2\Gamma_{11}(0)=I_1,\Gamma_{22}(0)=I_2$

相干程度

相干性只能保证两列光可以发生干涉，但是想要观察到明暗分明的干涉条纹，我们需要质量比较好的干涉，根据干涉项与光强的关系，定义degree of coherence（相干程度）来衡量干涉的质量：
$γ12(τ)=Γ12(τ)Γ11(0)Γ22(0)\gamma_{12}(\tau)=\frac{\Gamma_{12}(\tau)}{\sqrt{\Gamma_{11}(0)\Gamma_{22}(0)}}$

于是 $P$ 点处的光强为
$I(τ)=I1+I2+2I1I2Re[γ12(τ)]=I1+I2+2I1I2∣γ12(τ)∣cos⁡(ϕ12)I(\tau)=I_1+I_2+2\sqrt{I_1I_2}Re[\gamma_{12}(\tau)] \\ = I_1+I_2+2\sqrt{I_1I_2}|\gamma_{12}(\tau)|\cos(\phi_{12})$

第二个等式把 $γ12(τ)\gamma_{12}(\tau)$ 分解为幅度和幅角 $γ12(τ)=∣γ12(τ)∣eiϕ12\gamma_{12}(\tau)=|\gamma_{12}(\tau)|e^{i\phi_{12}}$ 代入即可得到，其中幅角 $ϕ12\phi_{12}$ 代表相位差，它由两列光的光程差决定，与 $P$ 的位置有关，决定明暗干涉条纹的分布；而幅度 $∣γ12(τ)∣|\gamma_{12}(\tau)|$ 则决定了两列光干涉明暗条纹区别是否明显，如果 $∣γ12(τ)∣=1|\gamma_{12}(\tau)|=1$ ，称这两列光complete coherence（完全同调或者完全相干），如果 $∣γ12(τ)∣=0|\gamma_{12}(\tau)|=0$ ，称这两列光complete incoherence（完全不相干），如果 $∣γ12(τ)∣∈(0,1)|\gamma_{12}(\tau)| \in (0,1)$ ，称这两列光partial coherence（部分相干），自然界中的光几乎都是部分相干的。

干涉条纹清晰度

定义干涉条纹的清晰度(fringe visibility)为
$v=Imax−IminImax+Imin=2I1I2I1+I2∣γ12(τ)∣v=\frac{I_{max}-I_{min}}{I_{max}+I_{min}}=\frac{2\sqrt{I_1I_2}}{I_1+I_2}|\gamma_{12}(\tau)|$

$v$ 是0到1之间的一个数， $v$ 越大代表明暗条纹亮度差别越大，干涉条纹也就越明显，这个量在实验光学中有重要意义：

在干涉实验中， $v$ 可以通过对明暗条纹的亮度测量得到，而 $∣γ12(τ)∣|\gamma_{12}(\tau)|$ 是更难计算的，但根据上述公式，通过 $v$ 可以用干涉实验间接测量 $∣γ12(τ)∣=v(I1+I2)2I1I2|\gamma_{12}(\tau)|=\frac{v(I_1+I_2)}{2\sqrt{I_1I_2}}$
当 $I_1=I_2$ 时， $v$ 取最大值 $∣γ12(τ)∣|\gamma_{12}(\tau)|$ ，所以在干涉实验中，要尽量让两列相干光强度相同

空间相干性

下面讨论影响 $∣γ12(τ)∣|\gamma_{12}(\tau)|$ 与 $S_1,S_2$ 相对位置的关系，专业术语叫做spatial coherence。在理论模型中 $S_1,S_2$ 都是点光源，点光源是没有大小的理想模型，但在光学建模中，我们需要考虑 $S_1,S_2$ 的形状与大小。下面我们用双缝干涉的模型做一点修正：

假设 $P$ 点离 $z$ 轴的距离为 $x$ ，光源上某一点离 $z$ 轴的距离为 $ξ\xi$ ，我们可以把光源上的每一点都看成是一个点光源，那么根据杨氏双缝干涉的公式，经过 $Q_1,Q_2$ （假设 $Q_1Q_2|=d$ ）分光后到达 $P$ 点的两列光光程差为（需要假设 $L,r_S>>d$ ）
$δ≈kd(xL+ξrS)\delta \approx kd(\frac{x}{L}+\frac{\xi}{r_S})$

这个点光源在 $P$ 点处产生的光强为
$dI(ξ)=I1+I2+2I1I2cos⁡(δ)dI(\xi)=I_1+I_2+2\sqrt{I_1I_2}\cos(\delta)$

于是这个光源在 $P$ 点处产生的光强等于所有点光源的积分： $I=∫−ΔS/2+ΔS/2dI(ξ)=ΔS[I1+I2+2I1I2sinc(dΔSλrS)cos⁡(kdxL)]I=\int_{-\Delta S/2}^{+\Delta S/2}dI(\xi) \\ = \Delta S \left[ I_1+I_2+2\sqrt{I_1I_2} sinc(\frac{d \Delta S}{\lambda r_S})\cos(\frac{kdx}{L}) \right]$

其中 $sinc(x)=sin⁡(πx)πxsinc(x)=\frac{\sin (\pi x)}{\pi x}$ ；除了因子 $ΔS\Delta S$ 外，这个结果与杨氏双缝干涉相比只是多了 $sinc(dΔSλrS)sinc(\frac{d \Delta S}{\lambda r_S})$ 这一项。考虑一种简单的情况，如果 $I_1=I_2$ ，则
$v=∣sinc(dΔSλrS)∣=∣γ12(τ)∣v=|sinc(\frac{d \Delta S}{\lambda r_S})|=|\gamma_{12}(\tau)|$

这就可以衡量 $Q_1,Q_2$ 分光后两列光的spatial coherence。

比如如果要在地球上用太阳光做干涉实验，那么光源设计参数为 $ΔS=1.4×109m\Delta S=1.4 \times 10^9m$ （太阳直径）， $rS=1.5×1011mr_S=1.5 \times 10^{11}m$ （日地距离），于是需要双缝距离不超过 $lt=λ/θS≈50μml_t=\lambda/\theta_S \approx 50 \mu m$ ，当然这个例子只是粗略估计。

van Cittert-Zernike定理

van Cittert-Zernike定理给出了在已知光源设计参数时计算空间中任意两点的spatial coherence的方法。假设光源光强分布为 $I(ξ)I(\xi)$ ， $ξ\xi$ 表示在光源的坐标系中光源的位置，设计参数为 $ΔS,rS\Delta S,r_S$ ，分光点为 $Q_1,Q_2$ ，二者在分光坐标系中的位置为 $x_1, x_2$ ，于是
$γ12=∫ΔSI(ξ)ei2πλrS(x2−x1)dξ∫ΔSI(ξ)dξ\gamma_{12}=\frac{\int_{\Delta S} I(\xi)e^{i\frac{2\pi}{\lambda r_S}(x_2-x_1)}d\xi}{\int_{\Delta S}I(\xi)d \xi}$

其中分子就是光强分布从光源坐标系到分光坐标系的Fourier变换。

例对于圆形的光源， $circular(ξ/(w/2))circular(\xi/(w/2))$ ， $w$ 为光源直径，
$γ12=(w/2)2J1(πwρ)wρ/2,ρ=r0λrS\gamma_{12}=(w/2)^2\frac{J_1(\pi w \rho)}{w \rho/2},\rho = \frac{r_0}{\lambda r_S}$

于是
$lt≈1.22λθSl_t \approx 1.22 \frac{\lambda }{\theta_S}$

时间相干性

考虑同一个光源发出的光，经过 $S_1,S_2$ 两条不同的光路到达 $P$ 后可能存在时间差，假设光源是quasi-monochromatic，
$E⃗(t)=E⃗0e−iwteiϕ0(t)⏟initialphase\vec E(t) = \vec E_0 e^{-iwt}\underbrace{e^{i\phi_0(t)}}_{initial\ phase}$

则
$Γ12(τ)=⟨E⃗(t)E⃗∗(t+τ)⟩τ=I0eiwτ⟨ei[ϕ0(t)−ϕ0(t+τ)]⟩τγ12(τ)=⟨E⃗(t)E⃗∗(t+τ)⟩⟨E⃗2⟩=eiwτlim⁡T→∞1T∫0Tei[ϕ0(t)−ϕ0(t+τ)]dt\Gamma_{12}(\tau)=\langle \vec E(t)\vec E^*(t+\tau) \rangle_{\tau}= I_0e^{iw\tau} \langle e^{i[\phi_0(t)-\phi_0(t+\tau)]} \rangle_{\tau} \\ \gamma_{12}(\tau)=\frac{\langle \vec E(t)\vec E^*(t+\tau) \rangle}{\langle \vec E^2 \rangle} = e^{iw\tau} \lim_{T \to \infty} \frac{1}{T}\int_0^T e^{i[\phi_0(t)-\phi_0(t+\tau)]}dt$

所以相干程度是取决于初始相位的分布的。把quasi-monochromatic light source看成一系列点光源的集合，每一个点光源的电子发生跃迁时（跃迁时间为 $τ0\tau_0$ ）发光，初始相位受电子跃迁瞬间的自旋状态等因素影响是一个随机变量，因此对于quasi-monochromatic light source，在 $τ≤τ0\tau\le \tau_0$ (保证单频的条件)时发生干涉，
$γ12(τ)=eiwτ(1−ττ0)\gamma_{12}(\tau)=e^{iw\tau}(1-\frac{\tau}{\tau_0})$

称 $τ0\tau_0$ 为coherence time，称 $lc=cτ0l_c=c\tau_0$ 为coherence length，这是保证temporal coherence的最大光程差。

接下来讨论一下 $τ0\tau_0$ 与光源的关系，做Fourier变换
$E⃗(ν)=∫−∞+∞E⃗(t)e−2πiνtdt=∫−τ0/2τ0/2E⃗0e−i2π(ν−ν0)tdt=E⃗0τ0sinc((ν−ν0)τ0)\vec E(\nu)=\int_{-\infty}^{+\infty} \vec E(t)e^{-2 \pi i \nu t}dt \\ = \int_{-\tau_0/2}^{\tau_0/2} \vec E_0 e^{-i2 \pi(\nu – \nu_0)t}dt=\vec E_0 \tau_0 sinc((\nu – \nu_0)\tau_0)$

其中 $\pi \nu_0=w$ ，Fourier变换的结果就是光源发光的频谱，而功率谱是
$G(ν)=∣E⃗(ν)∣=E⃗02τ02sinc2((ν−ν0)τ0)G(\nu)=|\vec E(\nu)|=\vec E_0^2 \tau_0^2 sinc^2((\nu-\nu_0)\tau_0)$

中心频率为 $ν0\nu_0$ ，频宽或者称为线宽(linewidth)为
$Δν=1τ0\Delta \nu=\frac{1}{\tau_0}$

因此
$lc=cτ0=cΔνl_c=c\tau_0 = \frac{c}{\Delta \nu}$

也就是做temporal coherence时，coherence length取决于光源的频宽，频宽越小（也就是光源发出的光频率越接近单频），允许的光程差就能越大，实验的容错率也能更高。

物理光学10 相干光与相干性