嵌入式之什么是大端序与小端序 朱有鹏 1.大小端模式1 1.1、什么是大小端模式 大端模式(big endian)和小端模式(little endian),这两个词最早出现在小说中,原本和 计算机没关系。计算机通信发展起来后,遇到一个问题就是:在串口等串行通信中,一次只能发送1个字节。这时候我要发送一个int类型的数就遇到一个问题。int类型有4个字节,我是按照:byte0 byte1 byte2 byte3这样的顺序发送,还是按照byte3 byte2 byte1 byte0这样的顺序发送。 规则就是发送方和接收方必须按照同样的字节顺序来通信,否则就会出现错误。这就叫通信系统中的大小端模式。这是大小端这个词和计算机挂钩的最早问题。 现在我们讲的这个大小端模式,更多是指计算机存储系统的大小端。在计算机内存/硬盘/Nnad中。因为存储系统是32位的,但是数据仍然是按照字节为单位进行存放的。于是乎一个32位的二进制在内存中存储时有2种分布方式,高字节对应高地址(大端模式)、高字节对应低地址(小端模式) 以大端模式存储,其内存布局如下图: 以小端模式存储,其内存布局如下图: 大端模式和小端模式本身没有对错,没有优劣,理论上按照大端或小端都可以,但是要求存储时和读取时必须按照同样的大小端模式来进行,否则会出错。 现实的情况就是, 有些CPU公司用大端(譬如C51 单片机), 有些CPU用小端(譬如ARM)。(大部分是用小端模式,大端模式的不算多)。于是乎我们写代码时,当不知道当前环境是用大端模式还是小端模式时就需要用代码来检测当前系统的大小端。 经典笔试题:用C语言写一个函数来测试当前机器的大小端模式。 1.2、用union来测试机器的大小端模式 #include // 共用体中很重要的一点:a和b都是从u1的低地址开始的。 // 假设u1所在的4字节地址分别是:0、1、2、3的话, //那么a自然就是0、1、2、3; b所在的地址是0而不是3. union mynuion { int a; char b; }; // 如果是小端模式则返回1,大端模式则返回0 int is_little_endian(void) { union myunion u1; u1.a = 1; return u1.b; } int main(void) { int i = is_little_endian(); if (1 == i) { printf("小端模式n"); } else { printf("大端模式n"); } return 0; } 分析:u1.a = 1; (1)如果是以小端模式存储,u1.a的内存布局如下图:
则u1.b 等于 1。 (2)如果是以大端模式存储,u1.a的内存布局如下图:
则u1.b 等于 0; 1.3、指针方式来测试机器的大小端 #include int is_little_endian2(void) { int a = 1; char b = *((char *)(&a)); // 指针方式其实就是共用体的本质 return b; } int main(void) { int i = is_little_endian2(); if (1 == i) { printf("小端模式n"); } else { printf("大端模式n"); } return 0; } &a的内存映射: (char *)&a的内存映射: (1)如果a = 1是以小端模式存储,则b 等于 1 (2)如果a = 1是以大端模式存储,则b 等于 0 1.4、通信系统中的大小端(数组的大小端) 譬如要通过串口发送一个0x12345678给接收方,但是因为串口本身限制,只能以字节为单位来发送,所以需要发4次;接收方分4次接收,内容分别是:0x12、0x34、0x56、0x78.接收方接收到这4个字节之后需要去重组得到0x12345678,而不是得到0x78563412。 所以在通信双方需要有一个默契,就是:先发/先接的是高位还是低位?这就是通信中的大小端问题。一般来说是:先发低字节叫小端;先发高字节就叫大端。实际操作中,在通信协议里面会去定义大小端,明确告诉你先发的是低字节还是高字节。 在通信协议中,大小端是非常重要的,不管是使用别人定义的通信协议还是自己要去定义的通信协议,一定都要注意在通信协议中标明大小端的问题。
|