按下主机的电源键,伴随着屏幕上一闪而过的打印信息,片刻之后计算机就启动了,如果我们安装了多个系统,计算机会让我们选择一个系统来启动。。。这些过程中,计算机的内部都经历了什么?
接下来的内容将对计算机的启动有一个简单的介绍。
概览
市面上的个人计算机一般都搭载了各自的操作系统,eg:windows,macOS,Ubuntu等,这些操作系统的代码在计算机的硬盘或者U盘中,是不能自启动的,需要一个引导启动的程序来将它们加载到内存中,那么这个加载的过程就是计算机启动的流程。
- 强硬件相关的:由烧写在硬件电路中的程序负责执行引导流程
- 操作系统无关的:不论安装什么类型的操作系统,都要遵守引导程序的规则,否则无法被载入到内存中。
计算机的整个启动过程分成四个阶段:
- BIOS启动
- 主引导记录
- 硬盘启动
- 操作系统启动
BIOS启动
上个世纪70年代初,”只读内存”(read-only memory,缩写为ROM)问世,开机引导程序被写入ROM中,在计算机通电后,第一件事就是读取并执行这段程序。该过程有硬件厂商来实现。这段程序有一个名字叫 BIOS(Basic Input/Output System)。其主要流程如下:
1. 硬件自检
BIOS程序首先检查计算机硬件能否满足运行的基本条件,这叫做”硬件自检”(Power-On Self-Test),缩写为POST。如果硬件出现问题,主板会发出不同含义的蜂鸣,启动中止。如果没有问题,屏幕就会显示出CPU、内存、硬盘等信息。
2. 确定启动顺序
经过上一步的硬件自检完成后,BIOS把控制权转交给下一阶段的启动程序。这时,BIOS需要知道,”下一阶段的启动程序”具体存放在哪里。
如果你自己安装过系统,那么对这个一定不陌生。系统的启动并不一定是硬盘,也可能是U盘或者软盘,这一步的设置可以在BIOS中进行设定
BIOS会根据外部储存设备的排序,排在前面的设备就是优先转交控制权的设备。这种排序叫做”启动顺序”(Boot Sequence)。
主引导记录
BIOS按照”启动顺序”,把控制权转交给合适的储存设备。注意,这里并不是在启动顺序中排在首位,就一定从该设备启动的,因为要想真正的启动设备,该设备必须符合规范,计算机会读取该设备最前面的512个字节。如果这512个字节的最后两个字节是0x55和0xAA,表明这个设备可以用于启动;如果不是,表明设备不能用于启动,控制权于是被转交给”启动顺序”中的下一个设备。
这最前面的512个字节,就叫做”主引导记录”(Master boot record,缩写为MBR)。实现一个操作系统,必须要满足最后两个字节是0x55和0xAA即可,前面的510个字节,只要能正确将操作系统引导到内存即可。但是现代操作系统如果要实现更好的系统启动管理,没有一定的规范是不可能的。下面介绍下主引导记录的结构,并了解分区表的基本概念,但是依然要提醒,这并非必须的!
1 主引导记录的结构
“主引导记录”只有512个字节,是不可能放下整个操作系统的。其主要作用是,告诉计算机到硬盘的哪一个位置去找操作系统。
主引导记录由三个部分组成:
- 第1-446字节:调用操作系统的机器码。
- 第447-510字节:分区表(Partition table)。
- 第511-512字节:主引导记录签名(0x55和0xAA)。
其中,第二部分”分区表”的作用,是将硬盘分成若干个区。
2 分区表
在使用Windows时,我们的硬盘一般会划分C/D/E/F盘,操作系统一般会放在C盘(当然,这个并不是必须的,而是可以设置的),针对这种情况,”主引导记录” 就必须知道将控制权转交给哪个区,也就是说要具体从哪个盘启动操作系统。
分区表的长度只有64个字节,里面又分成四项,每项16个字节。所以,一个硬盘最多只能分四个一级分区,又叫做”主分区”。
每个主分区的16个字节,由6个部分组成:
- 第1个字节:如果为0x80,就表示该主分区是激活分区,控制权要转交给这个分区。四个主分区里面只能有一个是激活的。
- 第2-4个字节:主分区第一个扇区的物理位置(柱面、磁头、扇区号等等)。
- 第5个字节:主分区类型。
- 第6-8个字节:主分区最后一个扇区的物理位置。
- 第9-12字节:该主分区第一个扇区的逻辑地址。
- 第13-16字节:主分区的扇区总数。
最后的四个字节(”主分区的扇区总数”),决定了这个主分区的长度。也就是说,一个主分区的扇区总数最多不超过2的32次方。
如果每个扇区为512个字节,就意味着单个分区最大不超过2TB。再考虑到扇区的逻辑地址也是32位,所以单个硬盘可利用的空间最大也不超过2TB。如果想使用更大的硬盘,只有2个方法:一是提高每个扇区的字节数,二是增加扇区总数。
硬盘启动
这里以最常见的硬盘启动为例,计算机的控制权就要转交给硬盘的某个分区了,这里又分成三种情况。
1 卷引导记录
这种方式也是最常见的一种方式,计算机上只安装的一个操作系统,根据前面提到,四个主分区里面,只有一个是激活的。计算机会读取激活分区的第一个扇区,叫做”卷引导记录”(Volume boot record,缩写为VBR)。
“卷引导记录”的主要作用是,告诉计算机,操作系统在这个分区里的位置。然后,计算机就会加载操作系统了。
2 扩展分区和逻辑分区
随着硬盘越来越大,四个主分区已经不够了,需要更多的分区。但是,分区表只有四项,因此规定有且仅有一个区可以被定义成”扩展分区”(Extended partition)。
所谓”扩展分区”,就是指这个区里面又分成多个区。这种分区里面的分区,就叫做”逻辑分区”(logical partition)。一般这种情况是安装了双系统的情况,eg:我们在c盘安装了windows系统,同时又分出一个单独的盘用来安装Ubuntu。
计算机先读取扩展分区的第一个扇区,叫做”扩展引导记录”(Extended boot record,缩写为EBR)。它里面也包含一张64字节的分区表,但是最多只有两项(也就是两个逻辑分区)。
计算机接着读取第二个逻辑分区的第一个扇区,再从里面的分区表中找到第三个逻辑分区的位置,以此类推,直到某个逻辑分区的分区表只包含它自身为止(即只有一个分区项)。因此,扩展分区可以包含无数个逻辑分区。
但是,似乎很少通过这种方式启动操作系统,因为这种方式的安装较为复杂,同时无法给用户提供选择进入哪个系统,仅仅是作为了解,因为如果操作系统确实安装在扩展分区,一般采用下面Grub的方式启动。
3 启动管理器
安装双系统,这种情况最为常见的,如果你之前在window上安装过ubuntu的双系统,那么对Easybcd 这个软件应该不陌生,这个软件就是修改主引导记录的前512字节里面的代码,这时计算机读取”主引导记录”前面446字节的机器码之后,不再把控制权转交给某一个分区,而是运行事先安装的”启动管理器”(boot loader),由用户选择启动哪一个操作系统。Linux环境中,目前最流行的启动管理器是Grub。在计算机启动的时候,会出现一个菜单供你选择启动哪个系统。
操作系统启动
控制权转交给操作系统后,操作系统的内核首先被载入内存。
以Linux系统为例,先载入/boot目录下面的kernel。内核加载成功后,第一个运行的程序是/sbin/init。它根据配置文件 /etc/initab,产生init进程。这是Linux启动后的第一个进程,pid进程编号为1,其他进程都是它的后代。
然后,init线程加载系统的各个模块,比如窗口程序和网络程序,直至执行/bin/login程序,跳出登录界面,等待用户输入用户名和密码。
总结
计算机的启动,本质上就是要把操作系统加载到内存中,一旦操作系统加载到内存中,接下来就开始执行操作系统内部的逻辑了。
但是要实现这一功能,就必须引入一个引导程序,通过硬件上电后立即执行(BIOS),先检测当前硬件环境是否正常,历史原因,随着硬件的逐步发展,软盘,硬盘,U盘等存储介质的出现,BIOS也要兼容市面上的几种引导介质,接下来开始从设置好的启动顺序中逐个判断该设备是否可以引导操作系统。一旦确定了设备,接下来就要确定操作系统在目标引导设备上的具体位置,根据一层层的缩小范围,最终将操作系统加载到内存中。