01-01-Part 1 - 基础概念

Bo Zhang 2022-12-24 17:00:00
Categories: Tags:

1. 量子力学基础

Lutz 教授的专著开篇没用多少篇幅便引入了能带的概念,这对笔者而言是第一个难点。因此,笔者希望从初高中化学学到的对原子的认识开始,结合检索到的信息,配合量子力学的知识一步步的解释能带。这里,我们用粒子 (Particle) 来统称微观世界的物质。

§1.1. 三个假设

  1. 能量量子化 (Energy Quantization)
  2. 波粒二象性 (Wave–Particle Duality)
  3. 不确定原理 (Uncertainty Principle)

关于第一个假设,微观世界的能量是不连续的,并且以能量包的形式进行转换。能量包的最小单位叫做光子 (Photon),能量包只能是光子的整数倍。光子作为粒子的一种,可以用方程(1-1)表示:

其中 代表能量, 代表普朗克常数, 代表频率。
注:一般使用 来代表能量 (Energy),但为了和后面的电场 (Electrical Field) 区分,笔者使用能量的另一种表达方式——功 (Work),用符号 表示。

在第一条假设的基础上(光是一种粒子),De Broglie 认为粒子以波 (Wave) 的形式存在,即第二个假设。他假设粒子有相应的波长 (Wave Length),见方程(1-2):

其中 代表动量 (Momentum), 代表波长。在不考虑势能的情况下,自由粒子的动量和能量关系为:

关于第三个假设,这个原理给出了微观世界中粒子的位置和动量的关系。位置越精确,则动量的误差越大,反之亦然。所以我们无法确定粒子的位置。这个假设直接决定了我们在量子力学中处理粒子的一个一般策略,即:既然无法确定粒子的准确坐标,就将其替换为确定某个坐标位置可能出现的概率。

§1.2. 波函数和薛定谔方程

有了这三个假设,我们就可以描述粒子的运动了,但是让我们先从宏观世界的经典力学开始分析。

众所周知,机械能由势能和动能组成,在一维坐标系 中的表达方式为:

其中 代表质量, 代表速度, 代表势能 (Potential Energy)。代入方程(2-3),即用动量表示动能,得到方程(1-5):

到目前都还OK?那再复习一下线性代数。线性代数主要就是在讲各种向量和矩阵的运算,其中一个重要的概念叫特征值 (Eigen Value)。怎么理解特征值呢?借用知乎高赞回答,其实矩阵运算的本质就是把一个向量旋转并且按系数伸缩。而特征值就是说,当矩阵作用在它们上面时,只伸缩向量而不让其旋转的值。我们的世界是三维的,所以描述空间的物体我们要用到三个坐标系的值,即一个 的向量。这里我们为了简化只考虑一维的情况。

铺垫完毕,下面开始高能。

经典力学中,能量又被称为哈密顿量(还记得现代控制理论中的哈密顿方程吗?)哈密顿量 有一个算符 (Operator) ,符号为在力学量的上面加一个小尖帽。这些算符就相当于上面提到的线性代数中的矩阵。算符后面跟一个函数,表示把函数按照算符的方式进行运算。用算符的角度重新看待方程(1-5)我们可以得到:

这里势能的物理意义是说,粒子被束缚在晶体之内,且边界条件为晶体的长/宽/高。所以势能的算符还是它自己。而动量的算符表示为:

这个方程的推导有点复杂,是把波函数转化为三角函数,再用欧拉公式和方程(2-1)和(2-2)得来,具体推导不再赘述。把(1-7)代入(1-6)得到:

现在矩阵有了,还缺特征值。当然了,由于粒子是运动的,我们需要一个本征态或者本征方程,通过这个方程就可以解特征值。而这个本征方程就是波函数 。由于波函数求的是粒子出现在特定位置的概率,而概率是和时间无关的,所以我们可以分离时间变量,用波函数 表示:

现在,我们就完成了从经典力学到量子力学的过渡。而方程(1-9)就是定态的薛定谔方程。再仔细观察一下这个方程,我们发现它是一个算子和一个本征方程(特征值)的组合。实际上,在薛定谔提出方程(1-9)后并不能赋予它真实的物理意义。后来马克斯波恩某天突发奇想,认为波函数的模平方代表了概率密度函数,薛定谔方程至此才有了物理意义,即测量一个处在波函数状态的粒子的能量。至此,我们可以归纳出两个重要结论:

如果我们让方程(1-9)中的势能为 0,解出对应的波函数,得到:

其中 表示波数,其三维空间描述为波向量 (Wave Vector) ,它的方向代表了波的传播方向,其大小(即 )用方程(1-11)表示:

其中 为约化普朗克常数 (Reduced Planck Constant),也被称为狄拉克常数 (Dirac Constant),它和普朗克常数的关系为:

方程(1-11)表征了能量和波数的关系,这就是 空间能带图 (k-Space Diagram) 的由来。

2. 固体物理学基础

§2.1. 核外电子分布

关于单个原子 (Atom) ,我们知道:

核外电子的分布遵循:

还是以硅为例子,它每层的核外电子分别是 2,8,4。即第一层有一个能级 s , s 能级有一个小轨道,可以装 2 个电子。第二层有两个轨道 s 和 p ,s 能级有一个小轨道,装 2 个电子, p 能级有三个小轨道,装 6 个电子,一共 8 个电子。第三层也是两个轨道 s 和 p,只不过这时的 p 轨道只需要装满三个小轨道中的前两个即可。

§2.2. 电子跃迁和原子能级

先做个总结:

我们把每一个轨道对应的能量称为能级 (Energy Level)。各个轨道之间的电子可以互相移动,被称为电子跃迁 (Electronic Transitions) 。跃迁的方式有三种:

读者可以把电子的跃迁想象成爬楼梯。楼层对应电子的层数。每一层楼有多少台阶就对应了电子轨道的个数。爬台阶消耗的能量就对应电子的能级。不仅如此,能级还具有“分立”的特点。还是以爬楼梯为例,人可以一次爬一个台阶,也可爬两个、三个台阶。但是不能爬1.5个台阶或者2.3个台阶。即,电子只能从一个轨道跃迁到另一个轨道,不能存在于两个轨道之间。 这里需要注意,只有光子的能量等于两个轨道的能级差,电子才会吸收光子。同理,电子在释放光子时,这个光子对应的能量也是两个轨道的能级差。如果光子的能量不等于能级差,则光子不会被电子吸收。图 2-1 描述了三种跃迁方式。

图 2-1:电子的三种跃迁方式,其中 : a) 吸收; b) 自发发射; c) 受激发射

§2.3. 晶体结构

如果无数个原子整齐的排列在一起,每个原子核对最外层电子都有吸引力。因此,原子之间会形成共价键 (Covalent Bond),彼此形成稳定的晶体结构 (Crystal Structure)。以硅元素 (Si) 为例,其原子序数为 14,各层电子数由内到外分别为 2,8,4。在晶体中,各个硅原子之间通过共价键共用 4 个价电子 (Valence Electron) ,从而达到 8 电子的稳定状态。

关于晶体结构,我们需要知道:

关于声子有必要做进一步解释。我们知道声音是由于振动产生的。从量子力学的角度看,这种振动可以类比简谐运动,也看作一种波函数。那么我们需要知道:

§2.4. 能带理论

当我们在讨论能级时,都是在单个原子的层面进行讨论的。那么在晶体层面,就要引入能带 (Energy Band) 的概念了。

我们引入泡利不相容定理 (Pauli Exclusion Principle) 来解释能带的形成。关于定理的内容不做过多介绍,这个定理的结果是,相同的原子排列在一起时,它们的轨道会出现细微的不同,即一个原子的某一能级会比另一个原子的同一能级略高或略低。而在晶体中,同一轨道下,有无数个能级密集有序地排列,因此我们假设各个能带之间没有间隔。这样在能量轴上就形成了一条连续的带 (见图 2-2 ) ,被称为能带。

图 2-2:能级和能带关系的示意图

在介绍能带结构之前,先解释两个重要的概念:导带 (Conduction Band)价带 (Valence Band)。还是以硅为例,我们已经知道它有三个层,分别对应五个轨道 (1s, 2s, 2p, 3s, 3p)。充满了核外电子的轨道,被称为满带 (Filled Band) 。而满带中能量最高的那一条则被称为价带,用符号 表示。比价带的能量还高,但是轨道中完全没有电子填充的带被称为导带,用符号 表示。价带和导带中间的能量差叫做带隙 (Band Gap),用符号 表示,见图 2-3 。其实,图 2-3 可以看作是 关系图的“扁平化处理”。它展示了某个特定波数下,晶体中能量的关系。

图 2-3:能带模型示意图(未掺杂的)

当然,读者可能注意到,在图 2-3 中还有一个物理量 ,它代表了费米能级 (Fermi Level),是由统计力学得来的。这个概念留到后面再说。

§2.5. 导体、半导体和绝缘体

有了能带模型,我们就可以根据带隙的大小来区分导体、半导体和绝缘体了:

§2.6. 直接和间接带隙

直接和间接带隙的区别如图 2-4 所示。

图 2-4:直接和间接带隙

从图中可以看出,当价带的波数 时,导带所对应的能量是否为最小值。若刚好对应,则为直接带隙,反之为间接带隙。相比于直接带隙,间接带隙为什么会发生偏移呢?这是因为电子在间接带隙中从价带跃迁到导带的过程中,仅靠光子的能量无法达到动量守恒。电子中会遇到晶格散射 (Lattice Scatter),声子会给电子提供额外的动量。常见的直接带隙材料有 GaAs 和 GaN,间接带隙材料有 Si 和 SiC。

§2.7. 载流子

铺垫了这么多,终于到解答第一个问题的时候了:载流子是什么?

所谓载流子,就是指可以自由移动的带电荷的粒子。现在我们假设,晶格受热振动到达一定温度时,某一个共价键断裂了。由于只有价电子参与共价键的形成,位于价带的一个电子就可以在晶格上任意运动。把这个运动过程套在能带模型上,我们说价带的电子被激发 (excited) 到了导带上。

位于导带的电子不受任何束缚,被称为自由电子。只要外界施加电场,电子就会在导带上任意运动。需要注意的是,位于价带的电子并不是真正意义上的载流子,因为它们仍然被共价键束缚着,施加电场并不能让价带的电子运动。要知道,只有脱离共价键束缚的电子才能在宏观上形成电流,才具有载流子的特点。

由于半导体是电中性的,电子从价带被激发到导带后,原来价带的位置会出现一个带正电的电荷,被称为空穴 (Hole)。这时,其他位置的电子可以补上这个“洞”,继续形成稳定的共价键。那么在其他位置又会出现空穴。所以,我们也可以把空穴看作是运动的。从数学的角度上来说,引入空穴的概念能方便我们在价带中描述电子。打个比方,假设一个空间内可以装一百个球,其中有两个白球和九十八个红球。我们可以先数白球,然后用一百减去白球的数量就得到红球的数量。这样远比一个个数红球的数量来的方便。同理,在价带内,数空穴的个数远比在一堆电子中数自由电子方便。

综上可以得出结论:

§2.8. 有效质量

由于载流子在晶体中总是会受到晶格各种奇奇怪怪的影响,我们很难分析载流子受到的内力。于是为了简化计算,我们引入有效质量 (Effective Mass) ,并且把载流子强行看作是不受势能影响的。换言之,它是质量和内力共同作用的结果。这样一来,我们只需要考虑载流子受到的外力(即电场),其结果是让载流子产生动能,这可以直接用经典力学中的牛顿第二定律表示:

其中 表示电荷, 表示质量, 表示加速度。

有效质量的这种近似分析可以用于以下两种粒子:

§2.9. 状态密度函数

根据泡利不相容原理,一个电子只能占据一个量子态。所以我们可以说,量子态的数量表征了载流子的数量。既然能带是由无数个能级整齐排列形成的。那么每一条能带在空间上都占据一定的体积,这个体积内还包含着能量。自然,我们需要一个函数来表征单位体积和单位能量中量子态的数量,这就是状态密度 (Densities of States) 函数。关于状态密度函数的推导只说一下思路:

  1. 利用无限深势阱模型对载流子进行建模,得到状态密度函数
  2. 假设载流子的能量和动量之间是抛物线关系,根据 k 空间能带图求出能量 的关系,得到
  3. 用有效质量代替理想粒子质量得到有效状态密度 (Effective Densities of States)

导带中的有效电子状态密度为:

价带中的有效空穴状态密度为:

3. 统计力学基础

§3.1. 费米分布

统计力学是从微观的角度考虑热平衡的相关问题。还记得不确定原理吗?统计力学告诉我们,对于晶体,电子被占据的概率和温度以及能量有关,可以用费米分布(Fermi Distribution) 来表示:

其中 表示温度, 表示玻尔兹曼常数。

关于方程(3-1)我们需要知道:

由于 ,我们可以忽略方程(3-1)中分母项的 1,得到:

怎么理解这个方程呢?再用楼房来举个例子。电子就相当于住在房间里的人。我们通常习惯先从底层开始住人,一层一层往上排。在冬天(绝对零度)天气太冷,大家都窝在房间里不出去,那么每个房间住人(电子被占据)的概率就是 1 。最上面住人的那一层被称为费米能级。在费米能级之上,没有人住,所以房间住人的概率为 0 。再高一些的温度时,人们就想活动活动,于是就有概率去别的房间住。但是,在底层,所有房间都住满了人,他们想去空房间就要爬很高的楼层,“搬家”比较费事,所以他们去别的房间住的概率就比较小。楼层越高,人们“搬家”越轻松,住空房间的概率就越高。但是不管天气如何变化,只要不是绝对零度,住费米这一层的人都有一半的概率去住更高的楼层。

§3.2. 费米能级

其实仔细观察图 2-3 会发现,费米能级处于能隙的位置,这显然违背了能级是“分立”的前提。其实费米能级并不是真正存在的能级,只是一个统计学上的值。那么我们为什么要引入这个分布呢?这是为了回答第二个问题:载流子在哪?做铺垫。