01.基础语法
目录介绍
- 1.1 C语言介绍和特点
- 1.1.1 C语言历史
- 1.1.2 C语言的特点
- 1.1.3 C语言的版本
- 1.2 C语言环境编译
- 1.2.1 环境设置
- 1.2.2 C语言的编译
- 1.3 掌握第一个程序
- 1.3.1 HelloWorld
- 1.3.2 编译源文件
- 1.4 基本语法介绍
- 1.4.1 语句
- 1.4.2 语句块
- 1.4.3 空格
- 1.4.4 注释
- 1.4.5 标准库头文件
- 1.5 修饰符和标识符
- 1.5.1 修饰符
- 1.5.2 标识符
- 1.5.3 常见关键字
- 1.6 运算符&表达式
- 1.6.1 自增运算符
- 1.6.2 算术运算符
- 1.6.3 关系运算符
- 1.6.4 逻辑运算符
- 1.6.5 条件运算符
- 1.6.6 位运算符
- 1.6.7 运算符优先级
- 1.6.8 sizeof运算符
1.1 C语言介绍和特点
1.1.1 C语言历史
C 语言最初是作为 Unix 系统的开发工具而发明的。
1969年,美国贝尔实验室的肯·汤普森Ken Thompson)与丹尼斯·里奇Dennis Ritchie)一起开发了 Unix 操作系统。Unix 是用汇编语言写的,无法移植到其他计算机,他们决定使用高级语言重写。但是,当时的高级语言无法满足他们的要求,汤普森就在 BCPL 语言的基础上发明了 B 语言。
1972年,丹尼斯·里奇和布莱恩·柯林汉Brian Kernighan)又在 B 语言的基础上重新设计了一种新语言,这种新语言取代了 B 语言,所以称为 C 语言。
1973年,整个 Unix 系统都使用 C 语言重写。此后,这种语言开始快速流传,广泛用于各种操作系统和系统软件的开发。
1988年,美国国家标准协会ANSI)正式将 C 语言标准化,标志着 C 语言开始稳定和规范化。
几十年后的今天,C 语言依然是最广泛使用、最流行的系统编程语言之一,Unix 和 Linux 系统现在还是使用 C 语言开发。
1.1.2 C语言的特点
C 语言能够长盛不衰、广泛应用,主要原因是它有一些鲜明的特点。
1)低级语言
C 语言能够直接操作硬件、管理内存、跟操作系统对话,这使得它是一种非常接近底层的语言,也就是低级语言,非常适合写需要跟硬件交互、有极高性能要求的程序。
2)可移植性
C 语言的原始设计目的,是将 Unix 系统移植到其他计算机架构。这使得它从一开始就非常注重可移植性,C 程序可以相对简单地移植到各种硬件架构和操作系统。
除了计算机,C 语言现在还是嵌入式系统的首选编程语言,汽车、照相机、家用电器等设备的底层系统都是用 C 语言编程,这也是因为它良好的可移植性。
3)简单性
C 语言的语法相对简单,语法规则不算太多,也几乎没有语法糖。一般来说,如果两个语法可以完成几乎相同的事情,C 语言就只会提供一种,这样大大减少了语言的复杂性。
而且,C 语言的语法都是基础语法,不提供高级的数据结构,比如 C 语言没有“类”class),复杂的数据结构都需要自己构造。
4)灵活性
C 语言对程序员的限制很少。它假设程序员知道自己在干嘛,不会限制你做各种危险的操作,你干什么都可以,后果也由自己负责。
C 语言的哲学是“信任程序员,不要妨碍他们做事”。比如,它让程序员自己管理内存,不提供内存自动清理功能。另外,也不提供类型检查、数组的负索引检查、指针位置的检查等保护措施。
表面上看,这似乎很危险,但是对于高级程序员来说,却有了更大的编程自由。不过,这也使得 C 语言的 debug 不太容易。
5)总结
上面这些特点,使得 C 语言可以写出性能非常强、完全发挥硬件潜力的程序,而且 C 语言的编译器实现难度相对较低。但是另一方面,C 语言代码容易出错,一般程序员不容易写好。
此外,当代很多流行语言都是以 C 语言为基础,比如 C++、Java、C#、JavaScript 等等。学好 C 语言有助于对这些语言加深理解。
1.1.3 C语言的版本
历史上,C 语言有过多个版本。
1)K&R C
K&R C
指的是 C 语言的原始版本。1978年,C 语言的发明者丹尼斯·里奇Dennis Ritchie)和布莱恩·柯林汉Brian Kernighan)合写了一本著名的教材《C 编程语言》The C programming language)。由于 C 语言还没有成文的语法标准,这本书就成了公认标准,以两位作者的姓氏首字母作为版本简称“K&R C”。
2)ANSI C又称 C89 或 C90)
C 语言的原始版本非常简单,对很多情况的描述非常模糊,加上 C 语法依然在快速发展,要求将 C 语言标准化的呼声越来越高。
1989年,美国国家标准协会ANSI)制定了一套 C 语言标准。1990年,国际标准化组织ISO)通过了这个标准。它被称为“ANSI C”,也可以按照发布年份,称为“C89 或 C90”。
3)C95
1995年,美国国家标准协会对1989年的那个标准,进行了补充,加入多字节字符和宽字符的支持。这个版本称为 C95。
4)C99
C 语言标准的第一次大型修订,发生在1999年,增加了许多语言特性,比如双斜杠//
)的注释语法。这个版本称为 C99,是目前最流行的 C 版本。
5)C11
2011年,标准化组织再一次对 C 语言进行修订,增加了 Unicode 和多线程的支持。这个版本称为 C11。
6)C17
C11 标准在2017年进行了修补,但发布是在2018年。新版本只是解决了 C11 的一些缺陷,没有引入任何新功能。这个版本称为 C17。
7)C2x
标准化组织正在讨论 C 语言的下一个版本,据说可能会在2023年通过,到时就会称为 C23。
1.2 C语言环境编译
1.2.1 环境设置
1.2.2 C语言的编译
C 语言是一种编译型语言,源码都是文本文件,本身无法执行。必须通过编译器,生成二进制的可执行文件,才能执行。编译器将代码从文本翻译成二进制指令的过程,就称为编译阶段,又称为“编译时”(compile time),跟运行阶段(又称为“运行时”)相区分。
目前,最常见的 C 语言编译器是自由软件基金会推出的 GCC 编译器,它可以免费使用。本书也使用这个编译器。Linux 和 Mac 系统可以直接安装 GCC,Windows 系统可以安装 MinGW。但是,也可以不用这么麻烦,网上有在线编译器,能够直接在网页上模拟运行 C 代码,查看结果,下面就是两个这样的工具。
- CodingGround: https://tutorialspoint.com/compile_c_online.php
- OnlineGDB: https://onlinegdb.com/online_c_compiler
本书的例子都使用 GCC 在命令行进行编译。
1.3 掌握第一个程序
1.3.1 HelloWorld
C 语言的源代码文件,通常以后缀名.c
结尾。下面是一个简单的 C 程序hello.c
。它就是一个普通的文本文件,任何文本编译器都能用来写。
#include <stdio.h>
int main(void) {
printf("Hello World\n");
return 0;
}
上面这个程序的唯一作用,就是在屏幕上面显示“Hello World”。
1.3.2 编译源文件
假设你已经安装好了 GCC 编译器,可以打开命令行,执行下面的命令。
$ gcc hello.c
上面命令使用gcc
编译器,将源文件hello.c
编译成二进制代码。注意,$
是命令行提示符,你真正需要输入的是$
后面的部分。
运行这个命令以后,默认会在当前目录下生成一个编译产物文件a.out
(assembler output 的缩写,Windows 平台为a.exe
)。执行该文件,就会在屏幕上输出Hello World
。
$ ./a.out
Hello World
GCC 的-o
参数(output 的缩写)可以指定编译产物的文件名。
$ gcc -o hello hello.c
上面命令的-o hello
指定,编译产物的文件名为hello
(取代默认的a.out
)。编译后就会生成一个名叫hello
的可执行文件,相当于为a.out
指定了名称。执行该文件,也会得到同样的结果。
$ ./hello
Hello World
GCC 的-std=
参数(standard 的缩写)还可以指定按照哪个 C 语言的标准进行编译。
$ gcc -std=c99 hello.c
上面命令指定按照 C99 标准进行编译。
注意,-std
后面需要用=
连接参数,而不是像上面的-o
一样用空格,并且=
前后也不能有多余的空格。
1.4 基本语法介绍
1.4.1 语句
C 语言的代码由一行行语句(statement)组成。语句就是程序执行的一个操作命令。C 语言规定,语句必须使用分号结尾,除非有明确规定可以不写分号。
int x = 1;
上面就是一个变量声明语句,声明整数变量x
,并且将值设为1
。
多个语句可以写在一行。
int x; x = 1;
上面示例是两个语句写在一行。所以,语句之间的换行符并不是必需的,只是为了方便阅读代码。
一个语句也可以写成多行,这时就要依靠分号判断语句在哪一行结束。
int x;
x
=
1
;
上面示例中,第二个语句x = 1;
被拆成了四行。编译器会自动忽略代码里面的换行。
1.4.2 语句块
C 语言允许多个语句使用一对大括号{}
,组成一个块,也称为复合语句(compounded statement)。在语法上,语句块可以视为多个语句组成的一个复合语句。
{
int x;
x = 1;
}
上面示例中,大括号形成了一个语句块。
大括号的结尾不需要添加分号。
1.4.3 空格
C 语言里面的空格,主要用来帮助编译器区分语法单位。如果语法单位不用空格就能区分,空格就不是必须的,只是为了增加代码的可读性。
int x = 1;
// 等同于
int x=1;
上面示例中,赋值号(=
)前后有没有空格都可以,因为编译器这里不借助空格,就能区分语法单位。
语法单位之间的多个空格,等同于单个空格。
int x = 1;
上面示例中,各个语法单位之间的多个空格,跟单个空格的效果是一样的。
空格还用来表示缩进。多层级的代码有没有缩进,其实对于编译器来说并没有差别,没有缩进的代码也是完全可以运行的。强调代码缩进,只是为了增强代码可读性,便于区分代码块。
大多数 C 语言的风格要求是,下一级代码比上一级缩进4个空格。为了书写的紧凑,本书采用缩写两个空格。
// 缩进四个空格
if (x > 0)
printf("positive\n");
// 缩进两个空格
if (x > 0)
printf("positive\n");
只包含空格的行被称为空白行,编译器会完全忽略该行。
1.4.4 注释
注释是对代码的说明,编译器会忽略注释,也就是说,注释对实际代码没有影响。
C 语言的注释有两种表示方法。第一种方法是将注释放在/*...*/
之间,内部可以分行。
/* 注释 */
/*
这是一行注释
*/
这种注释可以插在行内。
int open(char* s /* file name */, int mode);
上面示例中,/* file name */
用来对函数参数进行说明,跟在它后面的代码依然会有效执行。
这种注释一定不能忘记写结束符号*/
,否则很容易导致错误。
printf("a "); /* 注释一
printf("b ");
printf("c "); /* 注释二 */
printf("d ");
上面示例的原意是,第一行和第三行代码的尾部,有两个注释。但是,第一行注释忘记写结束符号,导致注释一延续到第三行结束。
第二种写法是将注释放在双斜杠//
后面,从双斜杠到行尾都属于注释。这种注释只能是单行,可以放在行首,也可以放在一行语句的结尾。这是 C99 标准新增的语法。
// 这是一行注释
int x = 1; // 这也是注释
不管是哪一种注释,都不能放在双引号里面。双引号里面的注释符号,会成为字符串的一部分,解释为普通符号,失去注释作用。
printf("// hello /* world */ ");
上面示例中,双引号里面的注释符号,都会被视为普通字符,没有注释作用。
编译时,注释会被替换成一个空格,所以min/* space */Value
会变成min Value
,而不是minValue
。
1.4.5 标准库头文件
程序需要用到的功能,不一定需要自己编写,C 语言可能已经自带了。程序员只要去调用这些自带的功能,就省得自己编写代码了。举例来说,printf()
这个函数就是 C 语言自带的,只要去调用它,就能实现在屏幕上输出内容。
C 语言自带的所有这些功能,统称为“标准库”(standard library),因为它们是写入标准的,到底包括哪些功能,应该怎么使用的,都是规定好的,这样才能保证代码的规范和可移植。
不同的功能定义在不同的文件里面,这些文件统称为“头文件”(header file)。如果系统自带某一个功能,就一定还会自带描述这个功能的头文件,比如printf()
的头文件就是系统自带的stdio.h
。头文件的后缀通常是.h
。
如果要使用某个功能,就必须先加载对应的头文件,加载使用的是#include
命令。这就是为什么使用printf()
之前,必须先加载stdio.h
的原因。
#include <stdio.h>
注意,加载头文件的#include
语句不需要分号结尾。
1.5 修饰符和标识符
1.5.1 修饰符
1.5.2 标识符
1.5.3 常见关键字
1.6 运算符&表达式
1.6.1 自增运算符
C 语言提供两个运算符,对变量自身进行+ 1
和- 1
的操作。
++
:自增运算符--
:自减运算符
i++; // 等同于 i = i + 1
i--; // 等同于 i = i - 1
这两个运算符放在变量的前面或后面,结果是不一样的。++var
和--var
是先执行自增或自减操作,再返回操作后var
的值;var++
和var--
则是先返回操作前var
的值,再执行自增或自减操作。
int i = 42;
int j;
j = (i++ + 10);
// i: 43
// j: 52
j = (++i + 10)
// i: 44
// j: 54
上面示例中,自增运算符的位置差异,会导致变量j
得到不同的值。这样的写法很容易出现意料之外的结果,为了消除意外,可以改用下面的写法。
/* 写法一 */
j = (i + 10);
i++;
/* 写法二 */
i++;
j = (i + 10);
上面示例中,变量i
的自增运算与返回值是分离的两个步骤,这样就不太会出错,也提高了代码的可读性。
1.6.2 算术运算符
算术运算符专门用于算术运算,主要有下面几种。
+
:正值运算符(一元运算符)-
:负值运算符(一元运算符)+
:加法运算符(二元运算符)-
:减法运算符(二元运算符)*
:乘法运算符/
:除法运算符%
:余值运算符
(1)+
,-
+
和-
既可以作为一元运算符,也可以作为二元运算符。所谓“一元运算符”,指的是只需要一个运算数就可以执行。一元运算符-
用来改变一个值的正负号。
int x = -12;
上面示例中,-
将12
这个值变成-12
。
一元运算符+
对正负值没有影响,是一个完全可以省略的运算符,但是写了也不会报错。
int x = -12;
int y = +x;
上面示例中,变量y
的值还是-12
,因为+
不会改变正负值。
二元运算符+
和-
用来完成加法和减法。
int x = 4 + 22;
int y = 61 - 23;
2)*
:运算符*
用来完成乘法。
int num = 5;
printf("%i\n", num * num); // 输出 25
3)/
: 运算符/
用来完成除法。注意,两个整数相除,得到还是一个整数。
float x = 6 / 4;
printf("%f\n", x); // 输出 1.000000
上面示例中,尽管变量x
的类型是float
(浮点数),但是6 / 4
得到的结果是1.0
,而不是1.5
。原因就在于 C 语言里面的整数除法是整除,只会返回整数部分,丢弃小数部分。
如果希望得到浮点数的结果,两个运算数必须至少有一个浮点数,这时 C 语言就会进行浮点数除法。
float x = 6.0 / 4; // 或者写成 6 / 4.0
printf("%f\n", x); // 输出 1.500000
上面示例中,6.0 / 4
表示进行浮点数除法,得到的结果就是1.5
。
下面是另一个例子。
int score = 5;
score = (score / 20) * 100;
上面的代码,你可能觉得经过运算,score
会等于25
,但是实际上score
等于0
。这是因为score / 20
是整除,会得到一个整数值0
,所以乘以100
后得到的也是0
。
为了得到预想的结果,可以将除数20
改成20.0
,让整除变成浮点数除法。
score = (score / 20.0) * 100;
4)%
: 运算符%
表示求模运算,即返回两个整数相除的余值。这个运算符只能用于整数,不能用于浮点数。
int x = 6 % 4; // 2
负数求模的规则是,结果的正负号由第一个运算数的正负号决定。
11 % -5 // 1
-11 % -5 // -1
-11 % 5 // -1
上面示例中,第一个运算数的正负号(11
或-11
)决定了结果的正负号。
5)赋值运算的简写形式: 如果变量对自身的值进行算术运算,C 语言提供了简写形式,允许将赋值运算符和算术运算符结合成一个运算符。
+=
-=
*=
/=
%=
下面是一些例子。
i += 3; // 等同于 i = i + 3
i -= 8; // 等同于 i = i - 8
i *= 9; // 等同于 i = i * 9
i /= 2; // 等同于 i = i / 2
i %= 5; // 等同于 i = i % 5
1.6.3 关系运算符
C 语言用于比较的表达式,称为“关系表达式”(relational expression),里面使用的运算符就称为“关系运算符”(relational operator),主要有下面6个。
>
大于运算符<
小于运算符>=
大于等于运算符<=
小于等于运算符==
相等运算符!=
不相等运算符
下面是一些例子。
a == b;
a != b;
a < b;
a > b;
a <= b;
a >= b;
关系表达式通常返回0
或1
,表示真伪。C 语言中,0
表示伪,所有非零值表示真。比如,20 > 12
返回1
,12 > 20
返回0
。
关系表达式常用于if
或while
结构。
if (x == 3) {
printf("x is 3.\n");
}
注意,相等运算符==
与赋值运算符=
是两个不一样的运算符,不要混淆。有时候,可能会不小心写出下面的代码,它可以运行,但很容易出现意料之外的结果。
if (x = 3) ...
上面示例中,原意是x == 3
,但是不小心写成x = 3
。这个式子表示对变量x
赋值3
,它的返回值为3
,所以if
判断总是为真。
为了防止出现这种错误,有的程序员喜欢将变量写在等号的右边。
if (3 == x) ...
这样的话,如果把==
误写成=
,编译器就会报错。
/* 报错 */
if (3 = x) ...
另一个需要避免的错误是,多个关系运算符不宜连用。
i < j < k
上面示例中,连续使用两个小于运算符。这是合法表达式,不会报错,但是通常达不到想要的结果,即不是保证变量j
的值在i
和k
之间。因为关系运算符是从左到右计算,所以实际执行的是下面的表达式。
(i < j) < k
上面式子中,i < j
返回0
或1
,所以最终是0
或1
与变量k
进行比较。如果想要判断变量j
的值是否在i
和k
之间,应该使用下面的写法。
i < j && j < k
1.6.4 逻辑运算符
逻辑运算符提供逻辑判断功能,用于构建更复杂的表达式,主要有下面三个运算符。
!
:否运算符(改变单个表达式的真伪)。&&
:与运算符(两侧的表达式都为真,则为真,否则为伪)。||
:或运算符(两侧至少有一个表达式为真,则为真,否则为伪)。
下面是与运算符的例子。
if (x < 10 && y > 20)
printf("Doing something!\n");
上面示例中,只有x < 10
和y > 20
同时为真,x < 10 && y > 20
才会为真。
下面是否运算符的例子。
if (!(x < 12))
printf("x is not less than 12\n");
上面示例中,由于否运算符!
具有比<
更高的优先级,所以必须使用括号,才能对表达式x < 12
进行否运算。当然,合理的写法是if (x >= 12)
,这里只是为了举例。
对于逻辑运算符来说,任何非零值都表示真,零值表示伪。比如,5 || 0
会返回1
,5 && 0
会返回0
。
逻辑运算符还有一个特点,它总是先对左侧的表达式求值,再对右边的表达式求值,这个顺序是保证的。如果左边的表达式满足逻辑运算符的条件,就不再对右边的表达式求值。这种情况称为“短路”。
if (number != 0 && 12/number == 2)
上面示例中,如果&&
左侧的表达式(number != 0
)为伪,即number
等于0
时,右侧的表达式(12/number == 2
)是不会执行的。因为这时左侧表达式返回0
,整个&&
表达式肯定为伪,就直接返回0
,不再执行右侧的表达式了。
由于逻辑运算符的执行顺序是先左后右,所以下面的代码是有问题的。
while ((x++ < 10) && (x + y < 20))
上面示例中,执行左侧表达式后,变量x
的值就已经变了。等到执行右侧表达式的时候,是用新的值在计算,这通常不是原始意图。
1.6.5 条件运算符
1.6.6 位运算符
C 语言提供一些位运算符,用来操作二进制位(bit)。
(1)取反运算符~
取反运算符~
是一个一元运算符,用来将每一个二进制位变成相反值,即0
变成1
,1
变成0
。
// 返回 01101100
~ 10010011
上面示例中,~
对每个二进制位取反,就得到了一个新的值。
注意,~
运算符不会改变变量的值,只是返回一个新的值。
(2)与运算符&
与运算符&
将两个值的每一个二进制位进行比较,返回一个新的值。当两个二进制位都为1
,就返回1
,否则返回0
。
// 返回 00010001
10010011 & 00111101
上面示例中,两个八位二进制数进行逐位比较,返回一个新的值。
与运算符&
可以与赋值运算符=
结合,简写成&=
。
int val = 3;
val = val & 0377;
// 简写成
val &= 0377;
(3)或运算符|
或运算符|
将两个值的每一个二进制位进行比较,返回一个新的值。两个二进制位只要有一个为1
(包含两个都为1
的情况),就返回1
,否则返回0
。
// 返回 10111111
10010011 | 00111101
或运算符|
可以与赋值运算符=
结合,简写成|=
。
int val = 3;
val = val | 0377;
// 简写为
val |= 0377;
(4)异或运算符^
异或运算符^
将两个值的每一个二进制位进行比较,返回一个新的值。两个二进制位有且仅有一个为1
,就返回1
,否则返回0
。
// 返回 10101110
10010011 ^ 00111101
异或运算符^
可以与赋值运算符=
结合,简写成^=
。
int val = 3;
val = val ^ 0377;
// 简写为
val ^= 0377;
(5)左移运算符<<
左移运算符<<
将左侧运算数的每一位,向左移动指定的位数,尾部空出来的位置使用0
填充。
// 1000101000
10001010 << 2
上面示例中,10001010
的每一个二进制位,都向左侧移动了两位。
左移运算符相当于将运算数乘以2的指定次方,比如左移2位相当于乘以4(2的2次方)。
左移运算符<<
可以与赋值运算符=
结合,简写成<<=
。
int val = 1;
val = val << 2;
// 简写为
val <<= 2;
(6)右移运算符>>
右移运算符>>
将左侧运算数的每一位,向右移动指定的位数,尾部无法容纳的值将丢弃,头部空出来的位置使用0
填充。
// 返回 00100010
10001010 >> 2
上面示例中,10001010
的每一个二进制位,都向右移动两位。最低的两位10
被丢弃,头部多出来的两位补0
,所以最后得到00100010
。
注意,右移运算符最好只用于无符号整数,不要用于负数。因为不同系统对于右移后如何处理负数的符号位,有不同的做法,可能会得到不一样的结果。
右移运算符相当于将运算数除以2的指定次方,比如右移2位就相当于除以4(2的2次方)。
右移运算符>>
可以与赋值运算符=
结合,简写成>>=
。
int val = 1;
val = val >> 2;
// 简写为
val >>= 2;
1.6.7 运算符优先级
优先级指的是,如果一个表达式包含多个运算符,哪个运算符应该优先执行。各种运算符的优先级是不一样的。
3 + 4 * 5;
上面示例中,表达式3 + 4 * 5
里面既有加法运算符(+
),又有乘法运算符(*
)。由于乘法的优先级高于加法,所以会先计算4 * 5
,而不是先计算3 + 4
。
如果两个运算符优先级相同,则根据运算符是左结合,还是右结合,决定执行顺序。大部分运算符是左结合(从左到右执行),少数运算符是右结合(从右到左执行),比如赋值运算符(=
)。
5 * 6 / 2;
上面示例中,*
和/
的优先级相同,它们都是左结合运算符,所以从左到右执行,先计算5 * 6
,再计算30 / 2
。
运算符的优先级顺序很复杂。下面是部分运算符的优先级顺序(按照优先级从高到低排列)。
- 圆括号(
()
) - 自增运算符(
++
),自减运算符(--
) - 一元运算符(
+
和-
) - 乘法(
*
),除法(/
) - 加法(
+
),减法(-
) - 关系运算符(
<
、>
等) - 赋值运算符(
=
)
由于圆括号的优先级最高,可以使用它改变其他运算符的优先级。
int x = (3 + 4) * 5;
上面示例中,由于添加了圆括号,加法会先于乘法进行运算。
完全记住所有运算符的优先级没有必要,解决方法是多用圆括号,防止出现意料之外的情况,也有利于提高代码的可读性。
1.6.8 sizeof运算符
sizeof
是 C 语言提供的一个运算符,返回某种数据类型或某个值占用的字节数量。它的参数可以是数据类型的关键字,也可以是变量名或某个具体的值。
// 参数为数据类型
int x = sizeof(int);
// 参数为变量
int i;
sizeof(i);
// 参数为数值
sizeof(3.14);
上面的第一个示例,返回得到int
类型占用的字节数量(通常是4
或8
)。第二个示例返回整数变量占用字节数量,结果与前一个示例完全一样。第三个示例返回浮点数3.14
占用的字节数量,由于浮点数的字面量一律存储为 double 类型,所以会返回8
,因为 double 类型占用的8个字节。
sizeof
运算符的返回值,C 语言只规定是无符号整数,并没有规定具体的类型,而是留给系统自己去决定,sizeof
到底返回什么类型。不同的系统中,返回值的类型有可能是unsigned int
,也有可能是unsigned long
,甚至是unsigned long long
,对应的printf()
占位符分别是%u
、%lu
和%llu
。这样不利于程序的可移植性。
C 语言提供了一个解决方法,创造了一个类型别名size_t
,用来统一表示sizeof
的返回值类型。该别名定义在stddef.h
头文件(引入stdio.h
时会自动引入)里面,对应当前系统的sizeof
的返回值类型,可能是unsigned int
,也可能是unsigned long
。
C 语言还提供了一个常量SIZE_MAX
,表示size_t
可以表示的最大整数。所以,size_t
能够表示的整数范围为[0, SIZE_MAX]
。
printf()
有专门的占位符%zd
或%zu
,用来处理size_t
类型的值。
printf("%zd\n", sizeof(int));
上面代码中,不管sizeof
返回值的类型是什么,%zd
占位符(或%zu
)都可以正确输出。
如果当前系统不支持%zd
或%zu
,可使用%u
(unsigned int)或%lu
(unsigned long int)代替。