`
ydbc
  • 浏览: 711346 次
  • 性别: Icon_minigender_1
  • 来自: 大连
文章分类
社区版块
存档分类
最新评论

【C语言】07-基本数据类型

阅读更多

一、取值范围

我们已经知道,不同数据类型所占的存储空间是不一样的。比如在64bit编译器环境下,char类型占用1个字节,int类型占用4个字节。字节长度不一样,包含的二进制位数就不一样,能表示的数据范围也就不一样。因此,int类型能表示的数据范围肯定比char类型大。下面来简单算算64bit编译器环境下int类型的取值范围。

1.推算int类型的取值范围

int类型占用4个字节,所以一共32位,那么按理来说,取值范围应该是:0000 0000 0000 0000 0000 0000 0000 0000~1111 1111 1111 1111 1111 1111 1111 1111,也就是10进制的0~232- 1。但是int类型是有正负之分的,包括了正数和负数,那怎么表示负数呢?就是拿最高位来当符号位,当最高位为0就是正数,最高位为1则是负数。即:1000 0000 1001 1011 1000 0000 1001 1011就是一个负数,0000 1001 0000 1101 0000 1001 0000 1101是一个正数。由于最高位是0才代表正数,因此最大的正数是0111 1111 1111 1111 1111 1111 1111 1111,也就是231- 1。而最小的负数就是1000 0000 0000 0000 0000 0000 0000 0000,也就是-231(为什么是这个值呢?可以根据前面章节提到的负数的二进制形式,自己去换算一下,看看1000 0000 0000 0000 0000 0000 0000 0000是不是-231。算不出也不用去纠结,不影响写代码,知道有这么一回事就完了)。因此,int类型的取值范围是-231~231- 1

注意:这个推算过程是不用掌握的,大致知道过程就行了,而且这个结论也不用去记,大致知道范围就行了。

2.各种数据类型的取值范围

int类型的取值范围已经会算了,那么其他数据类型的取值范围就能够以此类推。

(注:float和double由于是小数,它们的存储方式是特别不一样的,所以它们取值范围的算法也很不一样,这里不做介绍,也不用去掌握。e38表示乘以10的38次方,e-38表示乘以10的负38次方。)

上面表格中列出的只是64bit编译器环境下的情况。如果你的编译器是16bit或者32bit,这些数据类型的取值范围肯定是不一样的。比如int类型,在16bit编译器环境下是占用2个字节的,共16bit,所以int类型的取值范围是:-215~215- 1

3.数值越界

1> 例子演示

前面已经看到,每种数据类型都有自己的取值范围。如果给一个变量赋值了一个超出取值范围的数值,那后果会不堪设想。

复制代码
1 #include <stdio.h>
2 
3 int main()
4 {
5     int c = 1024 * 1024 * 1024 * 4;
6     
7     printf("%d\n", c);
8     return 0;
9 }
复制代码

我们都知道,int类型能保存的最大值是231-1。在第5行给int类型的变量c赋值一个比231-1大的数值:232(1024是210

先看看在终端中的输出结果:,可以看出输出的值是0。

2> 结果分析

我们可以简单分析一下为什么将232赋值给变量c之后输出的是0。232的 二进制形式是:1 00000000000000000000000000000000,一共有33位二进制数。变量c占用了4个字节,只能容纳32位二进制数,而且内存寻址是从大到小的,因此,变量c在内存中的存储形式是0000 0000000000000000000000000000,也就是0,最前面的那个1就不属于变量c的了。

3> 结论

可以发现,如果超出了变量的取值范围,那么将损失精度,得到“垃圾数据”(“垃圾数据”就是指并非我们想要的数据)。可是,有时候我们确实要存储一个很大很大的整数,比231-1还大的整数,这该怎么办呢?这个就要用到类型说明符,这这讲的后面会讨论。

二、char

1.简单使用

char是C语言中比较灵活的一种数据类型,称为“字符型”。既然叫“字符型”,那肯定是用来存储字符的,因此我们可以将一个字符常量赋值给一个字符型变量。

复制代码
1 #include <stdio.h>
2 
3 int main()
4 {
5     char c = 'A';
6     
7     printf("%c\n", c);
8     return 0;
9 }
复制代码

在第5行定义了一个char类型变量c,并将字符常量'A'赋值给了c。在第7行将字符变量c输出到屏幕,%c的意思是以字符的格式输出。

输出结果:

2.字符常量一定要用单引号括住

1> 下面的写法是错误的:

1 int main()
2 {
3     char c = A;
4     return 0;
5 }

编译器会直接报第3行的错,错误原因是:标识符A找不到。你直接写个大写A,编译器会认为这个A是一个变量。因此写成'A'才是正确的,或者在第3行代码的前面再定义1个变量名叫做A的char类型变量。

2> 下面的写法也是错误的:

1 int main()
2 {
3     char c = "A";
4     return 0;
5 }

第3行中的"A"并不是字符常量,而是字符串常量,将字符串"A"赋值给字符变量c是错误的做法。字符串和字符的存储机制不一样,因此"A"和'A'是有本质区别的。

3.字符型变量还可以当做整型变量使用

1个字符型变量占用1个字节,共8位,因此取值范围是-27~27-1。在这个范围内,你完全可以将字符型变量当做整型变量来使用。

复制代码
 1 #include <stdio.h>
 2 
 3 int main()
 4 {
 5     char c1 = -10;
 6     
 7     char c2 = 120;
 8     
 9     printf("c1=%d  c2=%d \n", c1, c2);
10     return 0;
11 } 
复制代码

由于第9行用的是%d,表示以十进制整数格式输出,输出结果:。因此,如果使用的整数不是很大的话,可以使用char代替int,这样的话,更节省内存开销。

4.字符型变量只能存储单字节字符

其实字符有2种类型:单字节字符和双字节字符。

  • 单字节字符:在内存中占用1个字节的字符。包括了26个英文字母的大小写、10个阿拉伯数字等字符;
  • 双字节字符:在内存中占用2个字节的字符。包括了中国、日本和韩国等国家的文字,比如汉字。

1个字符型变量只占用1个字节,所以1个字符型变量只能存储1个单字节字符。

下面的写法是错误的:

复制代码
1 #include <stdio.h>
2 
3 int main()
4 {
5     char c = 'ABCD';
6     
7     printf("%c\n", c);
8     return 0;
9 }
复制代码

编译器会对上面的代码发出警告,并不会报错,因此程序还是能够运行。由于变量c只能存储1个单字节字符,最终变量c只存储了'ABCD'中的'D'。

输出结果:

5.字符型变量不能存储汉字

在内存中,1个汉字需要用2个字节来存储,而1个字符型变量只占用1个字节的存储空间,所以字符型变量不能用来存储汉字。

下面的写法是错误的:

1 int main()
2 {
3     char c = '';    
4     return 0;
5 }

编译器会直接报第3行的错误。记住一个原则:单引号括住的必须是单字节字符

6.ASCII

说到字符,就不得不提ASCII这个概念

1> ASCII是基于拉丁字母的一套电脑编码系统,是现今最通用的单字节编码系统,全称是“American Standard Code for Information Interchange”。编码系统,看起来好像很高级,其实就是一个字符集---字符的集合。

2> ASCII字符集包括了:所有的大写和小写英文字母,数字0到9,标点符号,以及一些特殊控制字符:如退格、删除、制表、回车,一共128个字符,全部都是“单字节字符”。

3> 在计算机中的任何数据都是以二进制形式存储的,因此每个ASCII字符在内存中是以二进制形式存储的,而且只占用1个字节,二进制数的值就称为这个ASCII字符的ASCII值。比如大写字母A在内存中的二进制形式是:0100 0001,那么它的ASCII值就是65。

4> 下面是一张ASCII码字符表,ASCII码值的范围是0~127

5> 我们都知道1个char型变量只占用1个字节的存储空间,而所有的ASCII字符都是单字节字符,因此char型变量能存储任何ASCII字符。而且在使用char型变量存储ASCII字符时,可以直接用ASCII字符,也可以用ASCII值。

复制代码
 1 #include <stdio.h>
 2 
 3 int main()
 4 {
 5     char c1 = 65;
 6     
 7     char c2 = 'A';
 8     
 9     printf("c1=%c  c2=%c \n", c1, c2);
10     return 0;
11 }
复制代码

在第5、7行分别定义了字符型变量c1、c2。很明显,变量c2存储的是ACII字符'A';变量c1存储的是65,而ASCII值65对应的ASCII字符就是'A',因此变量c1存储的也是'A'。

由于第9行用的是%c,表示以字符格式输出,输出结果:

5> 经过上面的例子后,应该知道6和'6'的区别了吧

复制代码
 1 #include <stdio.h>
 2 
 3 int main()
 4 {
 5     char c1 = 6;
 6     
 7     char c2 = '6';
 8     
 9     printf("c1=%d  c2=%d \n", c1, c2);
10     return 0;
11 }
复制代码

第5行给变量c1赋值了整数6,第7行给变量c2赋值了字符'6','6'的ASCII值是54。

由于第9行用的是%d,表示以十进制整数格式输出,输出结果:

三、说明符

1.什么是说明符

1> 我们已经知道,在64bit编译器环境下,1个int类型变量取值范围是-231~231- 1,最大值是231-1。有时候,我们要使用的整数可能比231-1还大,比如234这个整数,如果还坚持用int类型变量来存储这个值的话,就会损失精度,得到的是垃圾数据。为了解决这个问题,C语言允许我们给int类型的变量加一些说明符,某些说明符可以增大int类型变量的长度,这样的话,int类型变量能存储的数据范围就变大了。

2> C语言提供了以下4种说明符,4个都属于关键字:

  • short 短型
  • long 长型
  • signed 有符号型
  • unsigned 无符号型

按照用途进行分类,short和long是一类,signed和unsigned是一类。

2.用法演示

这些说明符一般就是用来修饰int类型的,所以在使用时可以省略int

复制代码
 1 // 下面两种写法是等价的
 2  short int s1 = 1;
 3  short s2 = 1;
 4  
 5  // 下面两种写法是等价的
 6  long int l1 = 2;
 7  long l2 = 2;
 8  
 9  // 可以连续使用2个long
10  long long ll = 10;
11  
12  // 下面两种写法是等价的
13  signed int si1 = 3;
14  signed si2 = 3;
15  
16  // 下面两种写法是等价的
17  unsigned int us1 = 4;
18  unsigned us2 = 4;
19  
20  // 也可以同时使用2种修饰符
21  signed short int ss = 5;
22  unsigned long int ul = 5;
复制代码

1> 第2行中的short int和第3行中的short是等价的。

2> 看第10行,可以连续使用两个long。long的作用会在后面解释。

3> 注意第21和22行,可以同时使用两种不同的说明符。但是不能同时使用相同类型的修饰符,也就是说不能同时使用short和long 或者 不能同时使用signed和unsigned。

3.short和long

1> short和long可以提供不同长度的整型数,也就是可以改变整型数的取值范围。在64bit编译器环境下,int占用4个字节(32bit),取值范围是-231~231-1;short占用2个字节(16bit),取值范围是-215~215-1;long占用8个字节(64bit),取值范围是-263~263-1

2> 总结一下:在64位编译器环境下,short占2个字节(16位),int占4个字节(32位),long占8个字节(64位)。因此,如果使用的整数不是很大的话,可以使用short代替int,这样的话,更节省内存开销。

3> 世界上的编译器林林总总,不同编译器环境下,int、short、long的取值范围和占用的长度又是不一样的。比如在16bit编译器环境下,long只占用4个字节。不过幸运的是,ANSI \ ISO制定了以下规则:

  • short跟int至少为16位(2字节)
  • long至少为32位(4字节)
  • short的长度不能大于int,int的长度不能大于long
  • char一定为为8位(1字节),毕竟char是我们编程能用的最小数据类型

4> 可以连续使用2个long,也就是long long。一般来说,long long的范围是不小于long的,比如在32bit编译器环境下,long long占用8个字节,long占用4个字节。不过在64bit编译器环境下,long long跟long是一样的,都占用8个字节。

5> 还有一点要明确的是:short int等价于short,long int等价于long,long long int等价于long long

4.long的使用注意

1> 常量

long和int都能够存储整型常量,为了区分long和int,一般会在整型常量后面加个小写字母l,比如100l,表示long类型的常量。如果是long long类型呢,就加2个l,比如100ll。如果什么都不加,就是int类型的常量。因此,100是int类型的常量,100l是long类型的常量,100ll是long long类型的常量。

复制代码
 1 int main()
 2 {
 3     int a = 100;
 4     
 5     long b = 100l;
 6     
 7     long long c = 100ll;
 8     
 9     return 0;
10 } 
复制代码

变量a、b、c最终存储的值其实都是100,只不过占用的字节不相同,变量a用4个字节来存储100,变量b、c则用8个字节来存储100。

其实,你直接将100赋值给long类型的变量也是没问题的,照样使用。因为100是个int类型的常量,只要有4个字节,就能存储它,而long类型的变量b有8个字节,那肯定可以装下100啦。

复制代码
1 int main()
2 {
3     long b = 100;
4     
5     return 0;
6 }
复制代码

2> 输出

复制代码
1 #include <stdio.h>
2 
3 int main()
4 {
5     long a = 100000000000l;
6     
7     printf("%d\n", a);
8     return 0;
9 }
复制代码

在第5行定义了long类型变量a,在第7行尝试输出a的值。注意了,这里用的是%d,表示以十进制整数格式输出,%d会把a当做int类型来输出,它认为a是4个字节的。由于a是long类型的,占用8个字节,但是输出a的时候,只会取其中4个字节的内容进行输出,所以输出结果是:

又是传说的垃圾数据

那怎样才能完整地输出long类型呢?应该用格式符%ld

复制代码
1 #include <stdio.h>
2 
3 int main()
4 {
5     long a = 100000000000l;
6     
7     printf("%ld\n", a);
8     return 0;
9 }
复制代码

注意第7行,双引号里面的是%ld,表示输出1个long类型的整数,这时候的输出结果是:

如果是long long类型,应该用%lld

复制代码
1 #include <stdio.h>
2 
3 int main()
4 {
5     long long a = 100000000000ll;
6     
7     printf("%lld\n", a);
8     return 0;
9 }
复制代码

5.signed和unsigned

1> 首先要明确的:signed int等价于signed,unsigned int等价于unsigned

2> signed和unsigned的区别就是它们的最高位是否要当做符号位,并不会像short和long那样改变数据的长度,即所占的字节数。

  • signed:表示有符号,也就是说最高位要当做符号位,所以括正数、负数和0。其实int的最高位本来就是符号位,已经包括了正负数和0了,因此signed和int是一样的,signed等价于signed int,也等价于int。signed的取值范围是-231~ 231- 1
  • unsigned:表示无符号,也就是说最高位并不当做符号位,所以不包括负数。在64bit编译器环境下面,int占用4个字节(32bit),因此unsigned的取值范围是:0000 0000 0000 0000 0000 0000 0000 0000 ~ 1111 1111 1111 1111 1111 1111 1111 1111,也就是0 ~ 232- 1

6.signed、unsigned也可以修饰char,long还可以修饰double

知道有这么一回事就行了。

1 unsigned char c1 = 10;
2 signed char c2 = -10;
3 
4 long double d1 = 12.0;

7.不同数据类型所占用的存储空间

四、自动类型提升

1.什么是自动类型提升

先来看看下面的一则运算

复制代码
 1 #include <stdio.h>
 2 
 3 int main()
 4 {
 5     int a = 10;
 6     
 7     double d = a + 9.5;
 8     
 9     printf("%f \n", d);
10     
11     return 0;
12 }
复制代码

1> 在第5行定义了一个int类型的变量a,赋值了一个整数10。

2> 接着在第7行取出a的值10,加上浮点数9.5,这里做了一个“加法运算”,并且将“和”赋值给d。所以d的值应该是19.5。

3> 在第9行使用格式符%f输出浮点型变量d,默认是保留6位小数的。输出结果为:

4> 看似这么简单的运算,其实包含了一些语法细节在里面。严格来说,相同数据类型的值才能进行运算(比如加法运算),而且运算结果依然是同一种数据类型。第7行的情况是:变量a的值10是int类型(4字节),9.5是double类型(8字节)。很明显,10和9.5并不是相同数据类型。按理来说,10和9.5是不允许进行加法运算的。但是,系统会自动对占用内存较少的类型做一个“自动类型提升”的操作,也就把10提升为double类型。也就是说,本来是用4个字节来存放10的,现在改为用8个字节来存放10。因此,10和9.5现在都是用8个字节来存放的,都是double类型,然后就可以进行运算了。并且把运算结果赋值给double类型的变量d。

5> 需要注意的是:经过第7行代码后,变量a一直都还是int类型的,并没有变成double类型。1个变量在它定义的时候是什么类型,那么就一直都是什么类型。“自动类型提升”只是在运算过程中进行的。

2.常见的自动类型提升

复制代码
 1 int main()
 2 {
 3     float a = 10 + 3.45f;// int 提升为 float
 4     
 5     int b = 'A' + 32; // char 提升为 int
 6     
 7     double c = 10.3f + 5.7; // float 提升为 double
 8     
 9     return 0;
10 }
复制代码

1> 注意第5行,系统会将字符'A'提升为int类型数据,也就是转为'A'的ASCII值后再跟32进行加法运算。'A'的ASCII值是65,因此变量b的值为65+32=97。

2> 这个自动类型提升,知道有这么一回事就行了,不用死记这规则,因为系统会自动执行这个操作。

五、强制类型转换

1.什么是强制类型转换

先来看看下面的代码

复制代码
1 #include <stdio.h>
2 
3 int main()
4 {
5     int i = 10.7;
6     
7     printf("%d \n", i);
8     return 0;
9 }
复制代码

1> 注意第5行,我们将一个8个字节的浮点数10.7赋值给了只有4个字节存储空间的整型变量i。可以想象得到,把8个字节的内容塞给4个字节,肯定会损失精度。在第7行将变量i的值输出,输出结果是:

输出值为10,这是必然的。

2> 这里面也有一点语法细节,其实第5行做了一个“强制类型转换”的操作:由于左边是int类型的变量i,那么就会强制把double类型的10.7转换为int类型的10,并且把转换后的值赋值给了整型变量i。由于C语言是语法限制不严格,所以系统会自动强制转换,如果换做是其他语法严格的语言,比如Java,第5行代码早就报错了。

3> 如果写得严格一点,明显地进行“强制类型转换”,应该这样写:

复制代码
1 #include <stdio.h>
2 
3 int main()
4 {
5     int i = (int) 10.7;
6     
7     printf("%d \n", i);
8     return 0;
9 }
复制代码

注意第5行,在10.7的前面加了个(int),表示强制转换为int类型的数据。这样就绝对不会有语法问题了。总之你将一个浮点型数据转换为整型数据,就会丢失小数部分的值。

2.常见的强制类型转换

复制代码
 1 int main()
 2 {
 3     int a = 198l; // long 转换为 int
 4     
 5     char b = 65; // int 转换为 char
 6     
 7     int c = 19.5f; // float 转换为 int
 8     
 9     return 0;
10 }
复制代码

这个强制类型转换,知道有这么一回事就行了,不用死记这规则,因为很多时候系统会自动执行这个操作。

3.其他用法

前面看到的强制转换好像都是“大类型”转为“小类型”,其实这是不一样的,也可以由“小类型”转为“大类型”

复制代码
1 int main()
2 {
3     int a = 10;
4     
5     double b = (double)a  + 9.6;
6     
7     return 0;
8 }
复制代码

注意第5行,先将a的值强制转换为double类型后,再跟9.6进行加法运算。这样的话,系统就不用执行“自动类型提升”的操作了。其实你不强转也可以的,因为系统会做一个“自动类型提升”的操作,将变量a的值10提升为double类型。知道有这用法就行了,以后某些地方会用得上。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics