合起来就是
AX 的低位(0 - 7)位构成了 AL 寄存器,高 8 位(8 - 15)位构成了 AH 寄存器。AH 和 AL 寄存器是可以使用的 8 位寄存器,其他同理。
在认识了寄存器之后,我们通过一个示例来看一下数据的具体存储方式。
比如数据 19 ,它在 16 位存储器中所存储的表示如下
寄存器的存储方式是先存储低位,如果低位满足不了就存储高位,如果低位能够满足,高位用 0 补全,在其他低位能满足的情况下,其余位也用 0 补全。
8086 CPU 可以一次存储两种类型的数据
- 字节(byte):一个字节由 8 bit 组成,这是一种恒定不变的存储方式
- 字(word):字是由指令集或处理器硬件作为单元处理的固定大小的数据,对于 intel 来说,一个字长就是两个字节,字是计算机一个非常重要的特征,针对不同的指令集架构来说,计算机一次处理的数据也是不同的。也就是说,针对不同指令集的机器,一次能处理不用的字长,有字、双字(32位)、四字(64位)等。
我们上面探讨过,AX 的另外一个名字叫做累加寄存器或者简称为累加器,其可以分为 2 个独立的 8 位寄存器 AH 和 AL;在编写汇编程序中,AX 寄存器可以说是使用频率最高的寄存器。
下面是几段汇编代码
mov ax,20 /* 将 20 送入寄存器 AX*/
mov ah,80 /* 将 80 送入寄存器 AH*/
add ax,10 /* 将寄存器 AX 中的数值加上 8 */
❝
这里注意下:上面代码中出现的是 ax、ah ,而注释中确是 AX、AH ,其实含义是一样的,不区分大小写。
❞
AX 相比于其他通用寄存器来说,有一点比较特殊,AX 具有一种特殊功能的使用,那就是使用 DIV 和 MUL 指令式使用。
BX 寄存器❝
DIV 是 8086 CPU 中的除法指令。
MUL 是 8086 CPU 中的乘法指令。
❞
BX 被称为数据寄存器,即表明其能够暂存一般数据。同样为了适应以前的 8 位 CPU ,而可以将 BX 当做两个独立的 8 位寄存器使用,即有 BH 和 BL。BX 除了具有暂存数据的功能外,还用于 寻址,即寻找物理内存地址。BX 寄存器中存放的数据一般是用来作为偏移地址 使用的,因为偏移地址当然是在基址地址上的偏移了。偏移地址是在段寄存器中存储的,关于段寄存器的介绍,我们后面再说。
CX 寄存器CX 也是数据寄存器,能够暂存一般性数据。同样为了适应以前的 8 位 CPU ,而可以将 CX 当做两个独立的 8 位寄存器使用,即有 CH 和 CL。除此之外,CX 也是有其专门的用途的,CX 中的 C 被翻译为 Counting 也就是计数器的功能。当在汇编指令中使用循环 LOOP 指令时,可以通过 CX 来指定需要循环的次数,每次执行循环 LOOP 时候,CPU 会做两件事
- 一件事是计数器自动减 1
- 还有一件就是判断 CX 中的值,如果 CX 中的值为 0 则会跳出循环,而继续执行循环下面的指令,当然如果 CX 中的值不为 0 ,则会继续执行循环中所指定的指令 。
DX 也是数据寄存器,能够暂存一般性数据。同样为了适应以前的 8 位 CPU ,DX 的用途其实在前面介绍 AX 寄存器时便已经有所介绍了,那就是支持 MUL 和 DIV 指令。同时也支持数值溢出等。
段寄存器CPU 包含四个段寄存器,用作程序指令,数据或栈的基础位置。实际上,对 IBM PC 上所有内存的引用都包含一个段寄存器作为基本位置。
段寄存器主要包含
- CS(Code Segment) :代码寄存器,程序代码的基础位置
- DS(Data Segment):数据寄存器,变量的基本位置
- SS(Stack Segment):栈寄存器,栈的基础位置
- ES(Extra Segment):其他寄存器,内存中变量的其他基本位置。
索引寄存器主要包含段地址的偏移量,索引寄存器主要分为
- BP(Base Pointer):基础指针,它是栈寄存器上的偏移量,用来定位栈上变量
- SP(Stack Pointer): 栈指针,它是栈寄存器上的偏移量,用来定位栈顶
- SI(Source Index): 变址寄存器,用来拷贝源字符串
- DI(Destination Index): 目标变址寄存器,用来复制到目标字符串
就剩下两种寄存器还没聊了,这两种寄存器是指令指针寄存器和标志寄存器:
- IP(Instruction Pointer):指令指针寄存器,它是从 Code Segment 代码寄存器处的偏移来存储执行的下一条指令
- FLAG : Flag 寄存器用于存储当前进程的状态,这些状态有
- 位置 (Direction):用于数据块的传输方向,是向上传输还是向下传输
- 中断标志位 (Interrupt) :1 - 允许;0 - 禁止
- 陷入位 (Trap) :确定每条指令执行完成后,CPU 是否应该停止。1 - 开启,0 - 关闭
- 进位 (Carry) : 设置最后一个无符号算术运算是否带有进位
- 溢出 (Overflow) : 设置最后一个有符号运算是否溢出
- 符号 (Sign) : 如果最后一次算术运算为负,则设置 1 =负,0 =正
- 零位 (Zero) : 如果最后一次算术运算结果为零,1 = 零
- 辅助进位 (Aux Carry) :用于第三位到第四位的进位
- 奇偶校验 (Parity) : 用于奇偶校验
我们大家都知道, CPU 访问内存时,需要知道访问内存的具体地址,内存单元是内存的基本单位,每一个内存单元在内存中都有唯一的地址,这个地址即是 物理地址。而 CPU 和内存之间的交互有三条总线,即数据总线、控制总线和地址总线。
CPU 通过地址总线将物理地址送入存储器,那么 CPU 是如何形成的物理地址呢?这将是我们接下来的讨论重点。
现在,我们先来讨论一下和 8086 CPU 有关的结构问题。
cxuan 和你聊了这么久,你应该知道 8086 CPU 是 16 位的 CPU 了,那么,什么是 16 位的 CPU 呢?
你可能大致听过这个回答,16 位 CPU 指的是 CPU 一次能处理的数据是 16 位的,能回答这个问题代表你的底层还不错,但是不够全面,其实,16 位的 CPU 指的是
- CPU 内部的运算器一次最多能处理 16 位的数据
❝
运算器其实就是 ALU,运算控制单元,它是 CPU 内部的三大核心器件之一,主要负责数据的运算。
❞
- 寄存器的最大宽度为 16 位
❝
这个寄存器的最大宽度值就是通用寄存器能处理的二进制数的最大位数
❞
- 寄存器和运算器之间的通路为 16 位
❝
这个指的是寄存器和运算器之间的总线,一次能传输 16 位的数据
❞
好了,现在你应该知道为什么叫做 16 位 CPU 了吧。
在你知道上面这个问题的答案之后,我们下面就来聊一聊如何计算物理地址。
8086 CPU 有 20 位地址总线,每一条总线都可以传输一位的地址,所以 8086 CPU 可以传送 20 位地址,也就是说,8086 CPU 可以达到 2^20 次幂的寻址能力,也就是 1MB。8086 CPU 又是 16 位的结构,从 8086 CPU 的结构看,它只能传输 16 位的地址,也就是 2^16 次幂也就是 64 KB,那么它如何达到 1MB 的寻址能力呢?
原来,8086 CPU 的内部采用两个 16 位地址合成的方式来传输一个 20 位的物理地址,如下图所示