Total Pageviews

Monday 12 March 2012

linux的启动过程

凡是曾经使用过Linux的用户可能都会注意到,当计算机启动时,屏幕上会出现很多信息。一般情况下,这些信息我们可以通过以下的命令看到:
cat /var/log/dmesg | more
这些信息究竟有什么含义?这个问题看起来似乎很容易回答,因为只要在Linux参考书里查找一下,就会找出一个类似于这样的答案:“这是一些内核启动信息……”。但是“内核启动信息”到底是什么意思呢?
要想对Linux内部工作有所了解,就必须要对Linux内核的体系结构有一个全面的了解。下面我们就去揭开它的秘密。在此,我不想解释Linux内核的体系结构,只想解释(或者说是试图去解释)计算机系统启动进程中一些最基本的概念。这里所说的启动过程是指从按下开关到提示符出现的整个过程。
启动指的是什么
在操作系统的词汇里,启动是指通过处理器执行一些指令,把操作系统的一部分放入到主存中。在启动过程中,Linux内部的数据结构会被初始化,会被赋给一些初始值,并且某些进程会被创建。因为当计算机电源打开时,所有的硬件设备都处于一种不可预知的状态,内存也处于一种不活动的随机状态,所以,计算机的启动过程可以说是一个长且复杂的任务。因此,我们必须知道,之所以叫“启动”主要是因为计算机体系结构的原因。
在此提请读者注意:
1.对计算机内部的工作和内核的操作有一个基本的了解,对自己非常有益。
2.这篇文章中提到的所有文件,指的都是Linux内核2.4.2-2版本里的文件。这些文件对于所有的Linux内核来说都是相同的,并且可以在任何一个Linux系统里找到它们,此处我使用的是Red Hat 7.1。
3.在本文里,讨论范围限于IBM PC体系结构。
BIOS及其功能
当计算机打开电源时,内存里包含的是一些随机的数据,所有的东西都没有被初始化,操作系统也没有被加载。开始整个启动过程的是一个特殊的硬件电路,它触发CPU的Reset脚的逻辑值。然后,一些CPU的寄存器比如CS(一个分段寄存器:代码段寄存器,它指向含有程序指令的段),eip(在执行指令过程中,当CPU检测到一个意外事故发生时,它会做出三种类型的判断:错误、陷阱、中止,这取决于eip寄存器的值,它存储在内核模块栈里)就会被给定一个值。接着,物理地址为0xfffffff0的代码将被执行。这个地址被存储在一个只读存储器(ROM)里。BIOS(基本输入/输出系统)实际上是一段存储在ROM里的程序。它包含了一系列可以被某些操作系统调用,用于处理计算机各种硬件设备的中断驱动和低级程序。其中微软的DOS就是这样的一种操作系统。
Linux是否使用附于计算机系统的BIOS来初始化硬件设备?或者说,是否有其它的东西来完成同样的任务?不过这个问题没有那么简单,必须要了解一些知识。我们从80386模式开始。Intel微处理器实现地址翻译(从逻辑地址->线性地址->物理地址)有两种不同的途径,分别称作实模式和保护模式。实模式存在主要是为了使得处理器可以和较老的处理相兼容。事实上,所有的BIOS程序都是在实模式下运行的。但是,Linux内核是在保护模式下运行,而不是在实模式下。因此,一旦初始化完成后,Linux就不再使用BIOS,而是完全由自己来为计算机上的所有硬件提供驱动程序(这点和DOS是不一样的)。
那么什么时候Linux使用保护模式?为什么BIOS不能使用相同的模式?BIOS使用实模式是因为其在操作过程中使用的是实模式地址,并且在计算机刚打开电源时,只有实模式地址可用。一个实模式地址由段地址和偏移地址组成,因此,相应的物理地址就为段地址×(2×8)+偏移。
那么,这是不是意味着在整个启动过程中,Linux就从来不使用BIOS了呢?答案是否定的。在启动阶段,Linux从硬盘或者其它外部设备加载内核时,需要使用BIOS。
让我们来看一下启动时BIOS主要做了哪些操作:
1.BIOS要对硬件进行一系列彻底的检测。这个步骤主要是检查系统安装有哪些设备,以及它们工作是否正常。通常把这个步骤叫做自检(Power-On Self-Test,POST),这时会显示版本及其它很多相关的硬件信息。
2.BIOS要对硬件进行初始化。这一步非常重要,因为它要保证所有的硬件设备在IRQ(中断请求)和I/O端口操作时都没有冲突。等这步完成以后,它会显示一个已经安装的PCI设备表。
3.接着到了操作系统,BIOS将查找一个可以引导的操作系统。这取决于BIOS的设置,它可以从软盘、硬盘或者光盘启动。
4.一旦发现一个合法的设备,BIOS就会把其第一扇区的内容复制到物理地址,即从0×00007c00开始的内存中,然后跳至刚加载的地址并执行之。
到此为止,BIOS所要做的工作就全部完成了。
自举程序及其功用
BIOS调用一个专门的程序,这个程序的任务就是把操作系统的内核调入内存。这个程序就叫做自举程序(Boot Loader)。在我们继续下面内容之前,先来看一下启动系统的不同途径。
1.从软盘启动Linux
从软盘启动时,存储在软盘第一扇区的指令将被加载并执行。这个指令然后就会把其余的内核复制到内存中。
Linux内核可以装在1.44MB的软盘里,不过为了减少磁盘占用量,它们都进行了压缩。这个压缩过程是在编译时完成的,而解压缩的过程则由自举程序完成。
从软盘启动Linux时,自举程序要做的工作非常简单。它是一个位于/usr/src/linux-2.4.2/arch/i386/boot/bootsect.S的汇编语言文件。当我们编译Linux内核源代码,或者获取一个新的内核时,这个可执行的汇编代码就会被放在内核程序的前端。由此可见,要制作一个可启动的Linux软盘其实很简单。我们只要从磁盘的第一个扇区拷贝Linux内核,就可以创建一个可启动软盘。当BIOS加载软盘的第一个扇区时,它实际上拷贝的是自举程序。自举程序由BIOS调用(跳到物理地址为0×00007c00的位置),然后执行以下的操作:
(1)把自已从地址0×00007c00移动到0×00090000;
(2)使用地址0×00003ff4,创建“实模式”栈;
(3)设置磁盘参数表,这里使用的是BIOS提供的软盘驱动程序;
(4)通过调用BIOS程序显示“Loading”信息;
(5)自举程序调用BIOS程序来加载软盘上内核的setup()函数,并把它放在起始地址为0×00090200的内存中;
(6)接下来自举程序调用一个BIOS程序,这个程序从软盘加载剩余的内核程序,并将其放入起始地址为0×00010000(所谓的低地址)或者0×00100000(所谓的高地址);
(7)然后,跳转到setup()函数。
2.从硬盘启动Linux
当系统从硬盘启动时,启动过程又有所不同。硬盘的第一个扇区叫做MBR(Master Boot Record),其上存储着分区表和一个小程序。这个程序加载存储由操作系统的第一扇区来开始启动。Linux是一个高度灵活且非常优秀的软件,所以在MBR里,它使用一个叫做LILO的程序来代替上述的那个程序。LILO允许用户选择所要启动的操作系统。
一般来说,Linux是从硬盘启动的。这就需要不同的自举程序。在Intel系统里,用得最多的自举程序就是LILO。对于其它的体系结构,还存在着别的自举程序。LILO可以安装在MBR上(请注意:在安装Red Hat Linux时,有一个步骤会让用户选择把LILO安装到MBR或者引导扇区)或一个活动分区的引导扇区上。
由于LILO太大,MBR无法容纳,所以它被分成两部分。MBR(或者磁盘分区的引导扇区)包含有一个小的自举程序,它被BIOS载入到起始地址为0×00007c00的内存中。然后,这个小程序再把自己移到0×0009a000地址处,接着设置实模式栈,最后加载第二部分的LILO自举程序(请注意:实模式栈地址范围是0×0009b000 到0×0009a200)。
第二部分的LILO会从磁盘读取所有可用的操作系统,并且给用户列出,以选择所要启动的系统。一旦用户选择完成,自举程序就会加载相应的扇区内容到内存中并且执行之。
自举程序被BIOS调用时(跳到物理地址为0×00007c00处),要执行以下操作:
(1)把自已从地址0×00007c00移动到0×00090000;
(2)使用地址0×00003ff4,创建“实模式”栈;
(3)设置磁盘参数表。这里使用的是BIOS提供的软盘驱动程序;
(4)通过调用BIOS程序显示“Loading Linux”信息;
(5)自举程序调用BIOS程序来加载软盘上内核的setup()函数,并把它放在起始地址为0×00090200的内存中;
(6)接下来自举程序调用一个BIOS程序,这个程序从软盘加载剩余的内核程序,并将其放入起始地址为0×00010000或者0×00100000;
(7)然后,跳转到setup()函数。
现在我们就可以深入研究一下自举过程中不可缺少的汇编语言函数了。
Setup()函数可以在/usr/src/linux-2.4.2/arch/i386/boot/setup.S文件中找到。
Setup()函数代码是在完整的内核自举程序加载以后,才会跳到相应的函数代码处。在内核文件中,其偏移地址是0×200。这使得自举程序很容易找到这段代码,并将其拷贝到起始物理地址为0×00090200的内存中。
这个Setup()文函数到底是做什么用的?在计算机时里,内核要正确地操作所有硬件就必需首先要检测到它们,并且以一种有序的方式进行初始化。Setup()函数初始化所有的硬件设备,从而为内核操作它创造了一个环境。
但是,前面我们不是已经提到过BIOS会检测所有的硬件吗?虽然BIOS初始化了所有的硬件,但是Linux内核并不放心,它还要以自己的方式对所有的硬件进行初始化。Linux内核之所以要设计成这样,是为了增强可移植性和稳定性。这也是Linux内核要优于很多目前可用的Unix和类Unix内核的原因之一,并且也使得它在很多方面表现的非常出众。
Setup()函数主要完成以下任务:
(1)首先是检测系统可用内存的总量,它是通过BIOS程序来完成检测的;
(2)设置键盘重复延迟时间和重复速度;
(3)检测视频卡;
(4)重新初始化硬盘控制器和硬盘参数;
(5)检测一个MCA;
(6)检测一个PS/2定点设备(鼠标总线);
(7)检测高级电源管理器(APM)BIOS支持;
(8)检测内核在内存中的位置,如果在低地址0×00010000,就将其移到高地址0×00001000,如在高地址则不做任何移动;
(9)设置设备中断描述表(IDT)和全局描述表(GDT);
(10)如已经有了浮点单位(FPU),则重置之;
(11)重新调用程序中断控制器;
(12)通过设置cr0状态寄存器的PE位,把CPU从“实模式”切换到“保护模式”;
(13)跳转到stratup_32( )汇编语言函数。
第一个stratup_32( )函数做什么
在启动过程中要用到两个stratup_32( )函数,虽然它们都是汇编语言函数,但是却是两个完全不同的函数。我们这里所说的函数包含在/usr/src/linux-2.4.2/arch/i386/boot/compressed/head.S文件里。
Setup()文件执行后,这个函数就被加载到物理地址为0×00100000或者物理地址为0×00001000的内存中(取决于内核是载入高或者低内存)。
当执行这个函数时,会执行以下的操作:
(1)初始化段寄存器和一个临时栈。
(2)内核中没有初始化的数据都用0填充。它是通过symbols _edata和 _end来识别的。
(3)执行decompress_kernel( )函数。这个函数用于对Linux内核解压缩。这个时候,屏幕上将显示“Uncompressing Linux……”信息。解压缩完成后,就会显示“OK, booting the kernel”信息。现在有一个问题,就是解完压缩的内核被放置在什么位置?答案是如果Linux内核被加载低地址,那么解压缩的内核将被置于物理地址为0×00100000的地方。如果在高地址,则内核会被先解压到一个临时缓冲区中,待完成后再将其加载到物理地址为0×00100000的地方。
(4)最后,跳转到物理地址为0×00100000的地方执行。
到此为止,代码执行操作就由另外一个startup_32( )函数来接管。也就是说,第二个startup_32( )函数接管了启动过程。
第二个startup_32( )函数完成的功能
解压缩Linux内核的工作由另外一个startup_32( )函数来完成。该函数位于/usr/src/linux-2.4.2/arch/i386/kernel/head.S文件中。
这时你可能会说两个不同的函数用同一个名字不会出错吗?答案是不会的。因为两个函数都是到自己初始地址去执行,并且都有自己的执行环境,所以不会出错。
下面我们来看一下第二个startup_32( )函数的功能。当执行这个函数时,实际上是为第一个Linux进程(process 0)设置环境。这个函数将执行下面的操作:
(1)段寄存器将以最后的值进行初始化;
(2)为process 0设置内核模式栈;
(3)调用并且执行setup_idt( )函数,该函数将把所有的IDT填充空值;
(4)把从BIOS中获得的参数放在第一页的框架中;
(5)识别处理器的模式;
(6)使用GDT和IDT表加载gdtr和idtr寄存器;
(7)最后跳到start_kernel( )函数。
start_kernel( )函数功能
start_kernel( )函数完成Linux内核的初始化工作。这个函数执行后,所有的基本内核组件都将被初始化。这也是整个启动过程的最后一步。
该函数将完成以下的功能:
(1)执行paging_init( )函数初始化页表(Page Tables);
(2)执行mem_init( )函数初始化页描述符(Page Descriptors);
(3)执行trap_init( ) 和 init_IRQ( )函数,最后一次对IDT进行初始化;
(4)执行kmem_cache_init( )和kmem_cache_sizes_init ( )函数,对Slab Allocator进行初始化;
(5)执行time_init( )函数,初始化系统日期和时间;
(6)内核的线程process 1是通过调用kernel_thread( )来完成的。接着就建立其它的内核线程并且执行/sbin/init程序。
到此屏幕上就会显示“Linux version 2.4.2 ……”信息。此外,还会显示很多其它信息。最后,就会出现用户的登录提示符。这是在告诉用户Linux内核已经加载完成,用户已经可以使用。
总结
到现在为止,整个启动过程都已经描述完毕。其中提到的许多词汇我都没有解释,只简要说了一下IDT、GDT、eip寄存器和cs寄存器等。因为要对这些内容进行完整的解释需要很长篇幅,并且会导致我们这个话题不完整。如果要进行更深入地研究,请到Linux社区去求助,或者查找相关的资料。

No comments:

Post a Comment