c语言之共用体union、枚举、大小端模式
上一个专题我们详细的分享了c语言里面的结构体用法,读者在看这些用法的时候,可以一边看一边试验,掌握了这些基本用法就完全够用了,当然在以后的工作中,如果有遇到了更高级的用法,我们可以再来总结学习归纳。好了,开始我们今天的主题分享。
一、共用体union:
1、什么是共用体union?
这个共用体,估计大家平时在代码也比较少见,我去看了一下stm32的例程里面没怎么看到这个用法(下面的示例分享是在stm32里面找的);其实这个共用体union(也叫联合体)跟我们上次分享的结构体定义是非常像的,比如说:类型定义、变量定义、使用方法上很相似。就像下面两个例子一样,把许多类型联合在一起(不过虽然形式上类似,但是具体用法还是有区别的,下面会讲他们之间的区别):
union st{
int a;
char b;
};
2、共用体与结构体的区别:
结构体类似于一个包裹,结构体中的成员彼此是独立存在的,分布在内存的不同单元中,他们只是被打包成一个整体叫做结构体而已;共用体中的各个成员其实是一体的,彼此不独立,他们使用同一个内存单元。可以理解为:有时候是这个元素,有时候是那个元素。更准确的说法是同一个内存空间有多种解释方式。所以共用体用法总结如下:
union中可以定义多个成员,union的内存大小由最大的成员的大小来决定。
union成员共享同一块大小的内存,一次只能使用其中的一个成员。
对某一个成员赋值,会覆盖其他成员的值(这是为啥呢?,简单来讲就是因为他们共享一块内存。但前提是成员所占字节数相同,当成员所占字节数不同时只会覆盖相应字节上的值,比如对char成员赋值就不会把整个int成员覆盖掉,因为char只占一个字节,而int占四个字节)。
共用体union的存放顺序是所有成员都从低地址开始存放的。
3、代码实战:
#include
typedef union{
int a;
char c;
//int a;
// int b;
}st;
int main(void)
{
st haha;
haha.c='B';
// haha.a=10;
//haha.b=60;
printf("the haha size is %d\n",sizeof(haha));
printf("haha.c=%d\n",haha.c);
return 0;
}
#include
typedef union{
int a;
char c;
int b;
}st;
int main(void)
{
st haha;
haha.c='B';
haha.a=10;
haha.b=60;
printf("the haha size is %d\n",sizeof(haha));
printf("haha.c=%d,haha.a=%d,haha.b=%d\n",haha.c,haha.a,haha.b);
printf("the a is 0x%x\n",&haha.a);
printf("the c is 0x%x\n",&haha.c);
printf("the b is 0x%x\n",&haha.b);
return 0;
}
演示结果:
the haha size is 4
haha.c=66
the haha size is 4
haha.c=60,haha.a=60,haha.b=60
the a is 0x61feac
the c is 0x61feac
the b is 0x61feac
说明:
通过上面的代码示例,读者可以发现这个共用体的大小,并不是像我们之前结构体那样是把每个成员所占内存大小加起来,而是我们上面说的那样,共用体由成员占用内存大小最大的那个决定的,上面的示例中int 占用4个字节大小,为最大的,所以sizeof(haha)得出结果就是4个字节大小,而且读者细心可以发现到打印出来的结果a和b都是60,它是访问内存占用大小最大的那个成员的数值,因为那个'B'的acii码值是是66;通过示例,我们也发现共用体访问其成员方式跟结构体是一样的(上面也有说到过)。下面是和结构体做对比的代码示例:
#include
// 共用体类型的定义
struct mystruct
{
int a;
char b;
};
// a和b其实指向同一块内存空间,只是对这块内存空间的2种不同的解析方式。
// 如果我们使用u1.a那么就按照int类型来解析这个内存空间;如果我们使用
// u1.b那么就按照char类型
// 来解析这块内存空间。
union myunion
{
int a;
char b;
double c;
};
int main(void)
{
struct mystruct s1;
s1.a = 23;
printf("s1.b = %d.\n", s1.b); // s1.b = 0. 结论是s1.a和s1.b是独立无关的
printf("&s1.a = %p.\n", &s1.a);
printf("&s1.b = %p.\n", &s1.b);
union myunion u1; // 共用体变量的定义
u1.a = 23;
u1.b='B';
u1.a=u1.b; // 共用体元素的使用
printf("u1.a = %d.\n", u1.a);
printf("u1.b = %d.\n", u1.b);
printf("u1.c = %d.\n", u1.c);
// u1.b = 23.结论是u1.a和u1.b是相关的
// a和b的地址一样,充分说明a和b指向同一块内存,只是对这块内存的不同解析规则
printf("&u1.a = %p.\n", &u1.a);
printf("&u1.b = %p.\n", &u1.b);
printf("the sizeof u1 is %d\n",sizeof(u1));
return 0;
}
演示结果:
s1.b = 22.
&s1.a = 0061FEA8.
&s1.b = 0061FEAC.
u1.a = 66.
u1.b = 66.
u1.c = 66.4、
&u1.a = 0061FEA0.
&u1.b = 0061FEA0.
the sizeof u1 is 8
4、小结:
union的sizeof测到的大小实际是union中各个元素里面占用内存最大的那个元素的大小。因为可以存的下这个就一定能够存的下其他的元素。
union中的元素不存在内存对齐的问题,因为union中实际只有1个内存空间,都是从同一个地址开始的(开始地址就是整个union占有的内存空间的首地址),所以不涉及内存对齐。
二、枚举
1、什么是枚举?
枚举在C语言中其实是一些符号常量集。直白点说:枚举定义了一些符号,这些符号的本质就是int类型的常量,每个符号和一个常量绑定。这个符号就表示一个自定义的一个识别码,编译器对枚举的认知就是符号常量所绑定的那个int类型的数字。枚举符号常量和其对应的常量数字相对来说,数字不重要,符号才重要。符号对应的数字只要彼此不相同即可,没有别的要求。所以一般情况下我们都不明确指定这个符号所对应的数字,而让编译器自动分配。(编译器自动分配的原则是:从0开始依次增加。如果用户自己定义了一个值,则从那个值开始往后依次增加)。
2、为什么要用枚举,和宏定义做对比:
(1)C语言没有枚举是可以的。使用枚举其实就是对1、0这些数字进行符号化编码,这样的好处就是编程时可以不用看数字而直接看符号。符号的意义是显然的,一眼可以看出。而数字所代表的含义除非看文档或者注释。
(2)宏定义的目的和意义是:不用数字而用符号。从这里可以看出:宏定义和枚举有内在联系。宏定义和枚举经常用来解决类似的问题,他们俩基本相当可以互换,但是有一些细微差别。
(3)宏定义和枚举的区别:
枚举是将多个有关联的符号封装在一个枚举中,而宏定义是完全散的。也就是说枚举其实是多选一。
(4)使用枚举情况:
什么情况下用枚举?当我们要定义的常量是一个有限集合时(譬如一星期有7天,譬如一个月有31天,譬如一年有12个月····),最适合用枚举。(其实宏定义也行,但是枚举更好)
不能用枚举的情况下(定义的常量符号之间无关联,或者无限的),这个时候就用宏定义。
总结:
宏定义先出现,用来解决符号常量的问题;后来人们发现有时候定义的符号常量彼此之间有关联(多选一的关系),用宏定义来做虽然可以但是不贴切,于是乎发明了枚举来解决这种情况。
3、代码示例:
a、几种定义方法:
/* // 定义方法1,定义类型和定义变量分离开
enum week
{
SUN, // SUN = 0
MON, // MON = 1;
TUE,
WEN,
THU,
FRI,
SAT,
};
enum week today;
*/
/* // 定义方法2,定义类型的同时定义变量
enum week
{
SUN, // SUN = 0
MON, // MON = 1;
TUE,
WEN,
THU,
FRI,
SAT,
}today,yesterday;
*/
/* // 定义方法3,定义类型的同时定义变量
enum
{
SUN, // SUN = 0
MON, // MON = 1;
TUE,
WEN,
THU,
FRI,
SAT,
}today,yesterday;
*/
/* // 定义方法4,用typedef定义枚举类型别名,并在后面使用别名进行变量定义
typedef enum week
{
SUN, // SUN = 0
MON, // MON = 1;
TUE,
WEN,
THU,
FRI,
SAT,
}week;
*/
/* // 定义方法5,用typedef定义枚举类型别名,并在后面使
用别名进行变量定义
typedef enum
{
SUN, // SUN = 0
MON, // MON = 1;
TUE,
WEN,
THU,
FRI,
SAT,
}week;
b、错误类型举例(下面的举例中也加入了结构体作为对比):
/* // 错误1,枚举类型重名,编译时报错:error: conflicting
// types for ‘DAY’
typedef enum workday
{
MON, // MON = 1;
TUE,
WEN,
THU,
FRI,
}DAY;
typedef enum weekend
{
SAT,
SUN,
}DAY;
*/
/* // 错误2,枚举成员重名,编译时报错:redeclaration //of
// enumerator ‘MON’
typedef enum workday
{
MON, // MON = 1;
TUE,
WEN,
THU,
FRI,
}workday;
typedef enum weekend
{
MON,
SAT,
SUN,
}weekend;
// 结构体中元素可以重名
typedef struct
{
int a;
char b;
}st1;
typedef struct
{
int a;
char b;
}st2;
*/
说明:
经过测试,两个struct类型内的成员名称可以重名,而两个enum类型中的成员不可以重名。实际上从两者的成员在访问方式上的不同就可以看出了。struct类型成员的访问方式是:变量名.成员,而enum成员的访问方式为:成员名。因此若两个enum类型中有重名的成员,那代码中访问这个成员时到底指的是哪个enum中的成员呢?所以不能重名。但是两个#define宏定义是可以重名的,该宏名真正的值取决于最后一次定义的值。编译器会给出警告但不会error,下面的示例会让编译器发出A被重复定义的警告。
#include
#define A 5
#define A 7
int main(void)
{
printf("hello world\n");
return 0;
}
c、代码实战演示:
#include
typedef enum week
{
SUN, // SUN = 0
MON, // MON = 1;
TUE, //2
WEN, //3
THU,
FRI,
SAT,
}week;
int main(void)
{
// 测试定义方法4,5
week today;
today = WEN;
printf("today is the %d th day in week\n", today);
return 0;
}
演示结果:
today is the 3 th day in week
d、接着我们把上面枚举变量改变它的值(不按照编译模式方式来),看看会发生什么变化:
#include
typedef enum week
{
SUN, // SUN = 0
MON=8, // MON = 1;
TUE, //2
WEN, //3
THU,
FRI,
SAT,
}week;
int main(void)
{
// 测试定义方法4,5
week today,hh;
today = WEN;
hh=SUN;
printf("today is the %d th day in week\n", SUN);
printf("today is the %d th day in week\n", today);
return 0;
}
演示结果(我们可以看到改变了枚举成员值,它就在这个基础递增下面的成员值):
today is the 0 th day in week
today is the 10 th day in week
注意:
这里要注意,只能把枚举值赋予枚举变量,不能把元素的数值直接赋予枚举变量,如一定要把数值赋予枚举变量,则必须用强制类型转换,但是我在测试时,发现编译器居然可以这样赋值,读者最好自己测试一下(不过这里后面发现在c语言里面可以这样操作,在c++里面不可以这样操作,必须强制类型转换)。
枚举元素不是字符常量也不是字符串常量,使用时不要加单、双引号。
枚举类型是一种基本数据类型,而不是一种构造类型,因为它不能再分解为任何基本类型。
枚举值是常量,不是变量。
三、大小端模式:
1、什么是叫大小端模式?
a、什么叫大端模式(big-endian)?
在这种格式中,字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中。
b、什么叫小端模式(little-endian)?
与大端存储格式相反,在小端存储格式中,低地址中存放的是字数据的低字节,高地址存放的是字数据的高字节。
2、实际解释:
----- 我们把一个16位的整数0x1234存放到一个短整型变量(short)中。这个短整型变量在内存中的存储在大小端模式由下表所示:
地址偏移 | 大端模式 | 小端模式 |
0x00 | 12 | 34 |
0x01 | 34 | 12 |
说明:
由上表所知,采用大小模式对数据进行存放的主要区别在于在存放的字节顺序,大端方式将高位存放在低地址,小端方式将低位存放在低地址。
3、代码实战来判断大小端模式:
#include
// 共用体中很重要的一点:a和b都是从u1的低地址开始的。
// 假设u1所在的4字节地址分别是:0、1、2、3的话,那么a自然就是0、1、2、3;
// b所在的地址是0而不是3.
union myunion
{
int a;
char b;
};
// 如果是小端模式则返回1,小端模式则返回0
int is_little_endian(void)
{
union myunion u1;
u1.a = 1; // 地址0的那个字节内是1(小端)或者0(大端)
return u1.b;
}
int is_little_endian2(void)
{
int a = 1;
char b = *((char *)(&a)); // 指针方式其实就是共用体的本质
return b;
}
int main(void)
{
int i = is_little_endian2();
if (i == 1)
{
printf("小端模式\n");
}
else
{
printf("大端模式\n");
}
return 0;
}
演示结果:
这是小端模式
4、看似可行实则不行的测试大小端方式:位与、移位、强制类型转化:
#include
int main(void)
{
// 强制类型转换
int a;
char b;
a = 1;
b = (char)a;
printf("b = %d.\n", b); // b=1
/*
// 移位
int a, b;
a = 1;
b = a >> 1;
printf("b = %d.\n", b); //b=0
*/
/*
// 位与
int a = 1;
int b = a & 0xff; // 也可以写成:char b
printf("b = %d.\n", b); //b=1
*/
return 0;
}
说明:
(1)位与运算:
结论:位与的方式无法测试机器的大小端模式。(表现就是大端机器和小 端机器的&运算后的值相同的)
理论分析:位与运算是编译器提供的运算,这个运算是高于内存层次的(或者说&运算在二进制层次具有可移植性,也就是说&的时候一定是高字节&高字节,低字节&低字节,和二进制存储无关)。
(2)移位:
结论:移位的方式也不能测试机器大小端。
理论分析:原因和&运算符不能测试一样,因为C语言对运算符的级别是高于二进制层次的。右移运算永远是将低字节移除,而和二进制存储时这个低字节在高位还是低位无关的。
(3)强制类型转换和上面分析一样的。
5、通信系统中的大小端(数组的大小端)
(1)譬如要通过串口发送一个0x12345678给接收方,但是因为串口本身限制,只能以字节为单位来发送,所以需要发4次;接收方分4次接收,内容分别是:0x12、0x34、0x56、0x78.接收方接收到这4个字节之后需要去重组得到0x12345678(而不是得到0x78563412)。
(2)所以在通信双方需要有一个默契,就是:先发/先接的是高位还是低位?这就是通信中的大小端问题。
(3)一般来说是:先发低字节叫小端;先发高字节就叫大端。在实际操作中,在通信协议里面会去定义大小端,明确告诉你先发的是低字节还是高字节。
(4)在通信协议中,大小端是非常重要的,大家使用别人定义的通信协议还是自己要去定义通信协议,一定都要注意标明通信协议中大小端的问题。
四、总结:
上面分享了一些我们常用的一些用法,掌握了这些就可以了,当日后工作中有其他用法,再总结归纳,完善自己的知识体系。
叨叨一下,最近建了一个学习群,用于学习交流,需要加群的,加微信号:cyuyan2020,备注:加群
点【在看】是最大的支持