01.基础语法

目录介绍

1.1 C语言介绍和特点
- 1.1.1 C语言历史
- 1.1.2 C语言的特点
- 1.1.3 C语言的版本
1.2 C语言环境编译
- 1.2.1 环境设置
- 1.2.2 C语言的编译
1.3 掌握第一个程序
- 1.3.1 HelloWorld
- 1.3.2 编译源文件
1.4 基本语法介绍
- 1.4.1 语句
- 1.4.2 语句块
- 1.4.3 空格
- 1.4.4 注释
- 1.4.5 标准库头文件
1.5 修饰符和标识符
- 1.5.1 修饰符
- 1.5.2 标识符
- 1.5.3 常见关键字
1.6 运算符&表达式
- 1.6.1 自增运算符
- 1.6.2 算术运算符
- 1.6.3 关系运算符
- 1.6.4 逻辑运算符
- 1.6.5 条件运算符
- 1.6.6 位运算符
- 1.6.7 运算符优先级
- 1.6.8 sizeof运算符

1.1 C语言介绍和特点

1.1.1 C语言历史

C 语言最初是作为 Unix 系统的开发工具而发明的。

1969年，美国贝尔实验室的肯·汤普森Ken Thompson）与丹尼斯·里奇Dennis Ritchie）一起开发了 Unix 操作系统。Unix 是用汇编语言写的，无法移植到其他计算机，他们决定使用高级语言重写。但是，当时的高级语言无法满足他们的要求，汤普森就在 BCPL 语言的基础上发明了 B 语言。

1972年，丹尼斯·里奇和布莱恩·柯林汉Brian Kernighan）又在 B 语言的基础上重新设计了一种新语言，这种新语言取代了 B 语言，所以称为 C 语言。

1973年，整个 Unix 系统都使用 C 语言重写。此后，这种语言开始快速流传，广泛用于各种操作系统和系统软件的开发。

1988年，美国国家标准协会ANSI）正式将 C 语言标准化，标志着 C 语言开始稳定和规范化。

几十年后的今天，C 语言依然是最广泛使用、最流行的系统编程语言之一，Unix 和 Linux 系统现在还是使用 C 语言开发。

1.1.2 C语言的特点

C 语言能够长盛不衰、广泛应用，主要原因是它有一些鲜明的特点。

1）低级语言

C 语言能够直接操作硬件、管理内存、跟操作系统对话，这使得它是一种非常接近底层的语言，也就是低级语言，非常适合写需要跟硬件交互、有极高性能要求的程序。

2）可移植性

C 语言的原始设计目的，是将 Unix 系统移植到其他计算机架构。这使得它从一开始就非常注重可移植性，C 程序可以相对简单地移植到各种硬件架构和操作系统。

除了计算机，C 语言现在还是嵌入式系统的首选编程语言，汽车、照相机、家用电器等设备的底层系统都是用 C 语言编程，这也是因为它良好的可移植性。

3）简单性

C 语言的语法相对简单，语法规则不算太多，也几乎没有语法糖。一般来说，如果两个语法可以完成几乎相同的事情，C 语言就只会提供一种，这样大大减少了语言的复杂性。

而且，C 语言的语法都是基础语法，不提供高级的数据结构，比如 C 语言没有“类”class），复杂的数据结构都需要自己构造。

4）灵活性

C 语言对程序员的限制很少。它假设程序员知道自己在干嘛，不会限制你做各种危险的操作，你干什么都可以，后果也由自己负责。

C 语言的哲学是“信任程序员，不要妨碍他们做事”。比如，它让程序员自己管理内存，不提供内存自动清理功能。另外，也不提供类型检查、数组的负索引检查、指针位置的检查等保护措施。

表面上看，这似乎很危险，但是对于高级程序员来说，却有了更大的编程自由。不过，这也使得 C 语言的 debug 不太容易。

5）总结

上面这些特点，使得 C 语言可以写出性能非常强、完全发挥硬件潜力的程序，而且 C 语言的编译器实现难度相对较低。但是另一方面，C 语言代码容易出错，一般程序员不容易写好。

此外，当代很多流行语言都是以 C 语言为基础，比如 C++、Java、C#、JavaScript 等等。学好 C 语言有助于对这些语言加深理解。

1.1.3 C语言的版本

历史上，C 语言有过多个版本。

1）K＆R C

K&R C指的是 C 语言的原始版本。1978年，C 语言的发明者丹尼斯·里奇Dennis Ritchie）和布莱恩·柯林汉Brian Kernighan）合写了一本著名的教材《C 编程语言》The C programming language）。由于 C 语言还没有成文的语法标准，这本书就成了公认标准，以两位作者的姓氏首字母作为版本简称“K&R C”。

2）ANSI C又称 C89 或 C90）

C 语言的原始版本非常简单，对很多情况的描述非常模糊，加上 C 语法依然在快速发展，要求将 C 语言标准化的呼声越来越高。

1989年，美国国家标准协会ANSI）制定了一套 C 语言标准。1990年，国际标准化组织ISO）通过了这个标准。它被称为“ANSI C”，也可以按照发布年份，称为“C89 或 C90”。

3）C95

1995年，美国国家标准协会对1989年的那个标准，进行了补充，加入多字节字符和宽字符的支持。这个版本称为 C95。

4）C99

C 语言标准的第一次大型修订，发生在1999年，增加了许多语言特性，比如双斜杠//）的注释语法。这个版本称为 C99，是目前最流行的 C 版本。

5）C11

2011年，标准化组织再一次对 C 语言进行修订，增加了 Unicode 和多线程的支持。这个版本称为 C11。

6）C17

C11 标准在2017年进行了修补，但发布是在2018年。新版本只是解决了 C11 的一些缺陷，没有引入任何新功能。这个版本称为 C17。

7）C2x

标准化组织正在讨论 C 语言的下一个版本，据说可能会在2023年通过，到时就会称为 C23。

1.2 C语言环境编译

1.2.1 环境设置

1.2.2 C语言的编译

C 语言是一种编译型语言，源码都是文本文件，本身无法执行。必须通过编译器，生成二进制的可执行文件，才能执行。编译器将代码从文本翻译成二进制指令的过程，就称为编译阶段，又称为“编译时”（compile time），跟运行阶段（又称为“运行时”）相区分。

目前，最常见的 C 语言编译器是自由软件基金会推出的 GCC 编译器，它可以免费使用。本书也使用这个编译器。Linux 和 Mac 系统可以直接安装 GCC，Windows 系统可以安装 MinGW。但是，也可以不用这么麻烦，网上有在线编译器，能够直接在网页上模拟运行 C 代码，查看结果，下面就是两个这样的工具。

CodingGround: https://tutorialspoint.com/compile_c_online.php
OnlineGDB: https://onlinegdb.com/online_c_compiler

本书的例子都使用 GCC 在命令行进行编译。

1.3 掌握第一个程序

1.3.1 HelloWorld

C 语言的源代码文件，通常以后缀名.c结尾。下面是一个简单的 C 程序hello.c。它就是一个普通的文本文件，任何文本编译器都能用来写。

#include <stdio.h>

int main(void) {
  printf("Hello World\n");
  return 0;
}

上面这个程序的唯一作用，就是在屏幕上面显示“Hello World”。

1.3.2 编译源文件

假设你已经安装好了 GCC 编译器，可以打开命令行，执行下面的命令。

$ gcc hello.c

上面命令使用gcc编译器，将源文件hello.c编译成二进制代码。注意，$是命令行提示符，你真正需要输入的是$后面的部分。

运行这个命令以后，默认会在当前目录下生成一个编译产物文件a.out（assembler output 的缩写，Windows 平台为a.exe）。执行该文件，就会在屏幕上输出Hello World。

$ ./a.out
Hello World

GCC 的-o参数（output 的缩写）可以指定编译产物的文件名。

$ gcc -o hello hello.c

上面命令的-o hello指定，编译产物的文件名为hello（取代默认的a.out）。编译后就会生成一个名叫hello的可执行文件，相当于为a.out指定了名称。执行该文件，也会得到同样的结果。

$ ./hello
Hello World

GCC 的-std=参数（standard 的缩写）还可以指定按照哪个 C 语言的标准进行编译。

$ gcc -std=c99 hello.c

上面命令指定按照 C99 标准进行编译。

注意，-std后面需要用=连接参数，而不是像上面的-o一样用空格，并且=前后也不能有多余的空格。

1.4 基本语法介绍

1.4.1 语句

C 语言的代码由一行行语句（statement）组成。语句就是程序执行的一个操作命令。C 语言规定，语句必须使用分号结尾，除非有明确规定可以不写分号。

int x = 1;

上面就是一个变量声明语句，声明整数变量x，并且将值设为1。

多个语句可以写在一行。

int x; x = 1;

上面示例是两个语句写在一行。所以，语句之间的换行符并不是必需的，只是为了方便阅读代码。

一个语句也可以写成多行，这时就要依靠分号判断语句在哪一行结束。

int x;
x
=
1
;

上面示例中，第二个语句x = 1;被拆成了四行。编译器会自动忽略代码里面的换行。

1.4.2 语句块

C 语言允许多个语句使用一对大括号{}，组成一个块，也称为复合语句（compounded statement）。在语法上，语句块可以视为多个语句组成的一个复合语句。

{
  int x;
  x = 1;
}

上面示例中，大括号形成了一个语句块。

大括号的结尾不需要添加分号。

1.4.3 空格

C 语言里面的空格，主要用来帮助编译器区分语法单位。如果语法单位不用空格就能区分，空格就不是必须的，只是为了增加代码的可读性。

int x = 1;
// 等同于
int x=1;

上面示例中，赋值号（=）前后有没有空格都可以，因为编译器这里不借助空格，就能区分语法单位。

语法单位之间的多个空格，等同于单个空格。

int    x =     1;

上面示例中，各个语法单位之间的多个空格，跟单个空格的效果是一样的。

空格还用来表示缩进。多层级的代码有没有缩进，其实对于编译器来说并没有差别，没有缩进的代码也是完全可以运行的。强调代码缩进，只是为了增强代码可读性，便于区分代码块。

大多数 C 语言的风格要求是，下一级代码比上一级缩进4个空格。为了书写的紧凑，本书采用缩写两个空格。

// 缩进四个空格
if (x > 0)
    printf("positive\n");

// 缩进两个空格
if (x > 0)
  printf("positive\n");

只包含空格的行被称为空白行，编译器会完全忽略该行。

1.4.4 注释

注释是对代码的说明，编译器会忽略注释，也就是说，注释对实际代码没有影响。

C 语言的注释有两种表示方法。第一种方法是将注释放在/*...*/之间，内部可以分行。

/* 注释 */

/*
  这是一行注释
*/

这种注释可以插在行内。

int open(char* s /* file name */, int mode);

上面示例中，/* file name */用来对函数参数进行说明，跟在它后面的代码依然会有效执行。

这种注释一定不能忘记写结束符号*/，否则很容易导致错误。

printf("a "); /* 注释一
printf("b ");
printf("c "); /* 注释二 */
printf("d ");

上面示例的原意是，第一行和第三行代码的尾部，有两个注释。但是，第一行注释忘记写结束符号，导致注释一延续到第三行结束。

第二种写法是将注释放在双斜杠//后面，从双斜杠到行尾都属于注释。这种注释只能是单行，可以放在行首，也可以放在一行语句的结尾。这是 C99 标准新增的语法。

// 这是一行注释

int x = 1; // 这也是注释

不管是哪一种注释，都不能放在双引号里面。双引号里面的注释符号，会成为字符串的一部分，解释为普通符号，失去注释作用。

printf("// hello /* world */ ");

上面示例中，双引号里面的注释符号，都会被视为普通字符，没有注释作用。

编译时，注释会被替换成一个空格，所以min/* space */Value会变成min Value，而不是minValue。

1.4.5 标准库头文件

程序需要用到的功能，不一定需要自己编写，C 语言可能已经自带了。程序员只要去调用这些自带的功能，就省得自己编写代码了。举例来说，printf()这个函数就是 C 语言自带的，只要去调用它，就能实现在屏幕上输出内容。

C 语言自带的所有这些功能，统称为“标准库”（standard library），因为它们是写入标准的，到底包括哪些功能，应该怎么使用的，都是规定好的，这样才能保证代码的规范和可移植。

不同的功能定义在不同的文件里面，这些文件统称为“头文件”（header file）。如果系统自带某一个功能，就一定还会自带描述这个功能的头文件，比如printf()的头文件就是系统自带的stdio.h。头文件的后缀通常是.h。

如果要使用某个功能，就必须先加载对应的头文件，加载使用的是#include命令。这就是为什么使用printf()之前，必须先加载stdio.h的原因。

#include <stdio.h>

注意，加载头文件的#include语句不需要分号结尾。

1.5 修饰符和标识符

1.5.1 修饰符

1.5.2 标识符

1.5.3 常见关键字

1.6 运算符&表达式

1.6.1 自增运算符

C 语言提供两个运算符，对变量自身进行+ 1和- 1的操作。

++：自增运算符
--：自减运算符

i++; // 等同于 i = i + 1
i--; // 等同于 i = i - 1

这两个运算符放在变量的前面或后面，结果是不一样的。++var和--var是先执行自增或自减操作，再返回操作后var的值；var++和var--则是先返回操作前var的值，再执行自增或自减操作。

int i = 42;
int j;

j = (i++ + 10);
// i: 43
// j: 52

j = (++i + 10)
// i: 44
// j: 54

上面示例中，自增运算符的位置差异，会导致变量j得到不同的值。这样的写法很容易出现意料之外的结果，为了消除意外，可以改用下面的写法。

/* 写法一 */
j = (i + 10);
i++;

/* 写法二 */
i++;
j = (i + 10);

上面示例中，变量i的自增运算与返回值是分离的两个步骤，这样就不太会出错，也提高了代码的可读性。

1.6.2 算术运算符

算术运算符专门用于算术运算，主要有下面几种。

+：正值运算符（一元运算符）
-：负值运算符（一元运算符）
+：加法运算符（二元运算符）
-：减法运算符（二元运算符）
*：乘法运算符
/：除法运算符
%：余值运算符

（1）+，-

+和-既可以作为一元运算符，也可以作为二元运算符。所谓“一元运算符”，指的是只需要一个运算数就可以执行。一元运算符-用来改变一个值的正负号。

int x = -12;

上面示例中，-将12这个值变成-12。

一元运算符+对正负值没有影响，是一个完全可以省略的运算符，但是写了也不会报错。

int x = -12;
int y = +x;

上面示例中，变量y的值还是-12，因为+不会改变正负值。

二元运算符+和-用来完成加法和减法。

int x = 4 + 22;
int y = 61 - 23;

2）*：运算符*用来完成乘法。

int num = 5;
printf("%i\n", num * num); // 输出 25

3）/：运算符/用来完成除法。注意，两个整数相除，得到还是一个整数。

float x = 6 / 4;
printf("%f\n", x); // 输出 1.000000

上面示例中，尽管变量x的类型是float（浮点数），但是6 / 4得到的结果是1.0，而不是1.5。原因就在于 C 语言里面的整数除法是整除，只会返回整数部分，丢弃小数部分。

如果希望得到浮点数的结果，两个运算数必须至少有一个浮点数，这时 C 语言就会进行浮点数除法。

float x = 6.0 / 4; // 或者写成 6 / 4.0
printf("%f\n", x); // 输出 1.500000

上面示例中，6.0 / 4表示进行浮点数除法，得到的结果就是1.5。

下面是另一个例子。

int score = 5;
score = (score / 20) * 100;

上面的代码，你可能觉得经过运算，score会等于25，但是实际上score等于0。这是因为score / 20是整除，会得到一个整数值0，所以乘以100后得到的也是0。

为了得到预想的结果，可以将除数20改成20.0，让整除变成浮点数除法。

score = (score / 20.0) * 100;

4）%：运算符%表示求模运算，即返回两个整数相除的余值。这个运算符只能用于整数，不能用于浮点数。

int x = 6 % 4; // 2

负数求模的规则是，结果的正负号由第一个运算数的正负号决定。

11 % -5 // 1
-11 % -5 // -1
-11 % 5 // -1

上面示例中，第一个运算数的正负号（11或-11）决定了结果的正负号。

5）赋值运算的简写形式：如果变量对自身的值进行算术运算，C 语言提供了简写形式，允许将赋值运算符和算术运算符结合成一个运算符。

+=
-=
*=
/=
%=

下面是一些例子。

i += 3;  // 等同于 i = i + 3
i -= 8;  // 等同于 i = i - 8
i *= 9;  // 等同于 i = i * 9
i /= 2;  // 等同于 i = i / 2
i %= 5;  // 等同于 i = i % 5

1.6.3 关系运算符

C 语言用于比较的表达式，称为“关系表达式”（relational expression），里面使用的运算符就称为“关系运算符”（relational operator），主要有下面6个。

> 大于运算符
< 小于运算符
>= 大于等于运算符
<= 小于等于运算符
== 相等运算符
!= 不相等运算符

下面是一些例子。

a == b;
a != b;
a < b;
a > b;
a <= b;
a >= b;

关系表达式通常返回0或1，表示真伪。C 语言中，0表示伪，所有非零值表示真。比如，20 > 12返回1，12 > 20返回0。

关系表达式常用于if或while结构。

if (x == 3) {
  printf("x is 3.\n");
}

注意，相等运算符==与赋值运算符=是两个不一样的运算符，不要混淆。有时候，可能会不小心写出下面的代码，它可以运行，但很容易出现意料之外的结果。

if (x = 3) ...

上面示例中，原意是x == 3，但是不小心写成x = 3。这个式子表示对变量x赋值3，它的返回值为3，所以if判断总是为真。

为了防止出现这种错误，有的程序员喜欢将变量写在等号的右边。

if (3 == x) ...

这样的话，如果把==误写成=，编译器就会报错。

/* 报错 */
if (3 = x) ...

另一个需要避免的错误是，多个关系运算符不宜连用。

i < j < k

上面示例中，连续使用两个小于运算符。这是合法表达式，不会报错，但是通常达不到想要的结果，即不是保证变量j的值在i和k之间。因为关系运算符是从左到右计算，所以实际执行的是下面的表达式。

(i < j) < k

上面式子中，i < j返回0或1，所以最终是0或1与变量k进行比较。如果想要判断变量j的值是否在i和k之间，应该使用下面的写法。

i < j && j < k

1.6.4 逻辑运算符

逻辑运算符提供逻辑判断功能，用于构建更复杂的表达式，主要有下面三个运算符。

!：否运算符（改变单个表达式的真伪）。
&&：与运算符（两侧的表达式都为真，则为真，否则为伪）。
||：或运算符（两侧至少有一个表达式为真，则为真，否则为伪）。

下面是与运算符的例子。

if (x < 10 && y > 20)
  printf("Doing something!\n");

上面示例中，只有x < 10和y > 20同时为真，x < 10 && y > 20才会为真。

下面是否运算符的例子。

if (!(x < 12))
  printf("x is not less than 12\n");

上面示例中，由于否运算符!具有比<更高的优先级，所以必须使用括号，才能对表达式x < 12进行否运算。当然，合理的写法是if (x >= 12)，这里只是为了举例。

对于逻辑运算符来说，任何非零值都表示真，零值表示伪。比如，5 || 0会返回1，5 && 0会返回0。

逻辑运算符还有一个特点，它总是先对左侧的表达式求值，再对右边的表达式求值，这个顺序是保证的。如果左边的表达式满足逻辑运算符的条件，就不再对右边的表达式求值。这种情况称为“短路”。

if (number != 0 && 12/number == 2)

上面示例中，如果&&左侧的表达式（number != 0）为伪，即number等于0时，右侧的表达式（12/number == 2）是不会执行的。因为这时左侧表达式返回0，整个&&表达式肯定为伪，就直接返回0，不再执行右侧的表达式了。

由于逻辑运算符的执行顺序是先左后右，所以下面的代码是有问题的。

while ((x++ < 10) && (x + y < 20))

上面示例中，执行左侧表达式后，变量x的值就已经变了。等到执行右侧表达式的时候，是用新的值在计算，这通常不是原始意图。

1.6.5 条件运算符

1.6.6 位运算符

C 语言提供一些位运算符，用来操作二进制位（bit）。

（1）取反运算符～

取反运算符～是一个一元运算符，用来将每一个二进制位变成相反值，即0变成1，1变成0。

// 返回 01101100
~ 10010011

上面示例中，~对每个二进制位取反，就得到了一个新的值。

注意，~运算符不会改变变量的值，只是返回一个新的值。

（2）与运算符&

与运算符&将两个值的每一个二进制位进行比较，返回一个新的值。当两个二进制位都为1，就返回1，否则返回0。

// 返回 00010001
10010011 & 00111101

上面示例中，两个八位二进制数进行逐位比较，返回一个新的值。

与运算符&可以与赋值运算符=结合，简写成&=。

int val = 3;
val = val & 0377;

// 简写成
val &= 0377;

（3）或运算符|

或运算符|将两个值的每一个二进制位进行比较，返回一个新的值。两个二进制位只要有一个为1（包含两个都为1的情况），就返回1，否则返回0。

// 返回 10111111
10010011 | 00111101

或运算符|可以与赋值运算符=结合，简写成|=。

int val = 3;
val = val | 0377;

// 简写为
val |= 0377;

（4）异或运算符^

异或运算符^将两个值的每一个二进制位进行比较，返回一个新的值。两个二进制位有且仅有一个为1，就返回1，否则返回0。

// 返回 10101110
10010011 ^ 00111101

异或运算符^可以与赋值运算符=结合，简写成^=。

int val = 3;
val = val ^ 0377;

// 简写为
val ^= 0377;

（5）左移运算符<<

左移运算符<<将左侧运算数的每一位，向左移动指定的位数，尾部空出来的位置使用0填充。

// 1000101000
10001010 << 2

上面示例中，10001010的每一个二进制位，都向左侧移动了两位。

左移运算符相当于将运算数乘以2的指定次方，比如左移2位相当于乘以4（2的2次方）。

左移运算符<<可以与赋值运算符=结合，简写成<<=。

int val = 1;
val = val << 2;

// 简写为
val <<= 2;

（6）右移运算符>>

右移运算符>>将左侧运算数的每一位，向右移动指定的位数，尾部无法容纳的值将丢弃，头部空出来的位置使用0填充。

// 返回 00100010
10001010 >> 2

上面示例中，10001010的每一个二进制位，都向右移动两位。最低的两位10被丢弃，头部多出来的两位补0，所以最后得到00100010。

注意，右移运算符最好只用于无符号整数，不要用于负数。因为不同系统对于右移后如何处理负数的符号位，有不同的做法，可能会得到不一样的结果。

右移运算符相当于将运算数除以2的指定次方，比如右移2位就相当于除以4（2的2次方）。

右移运算符>>可以与赋值运算符=结合，简写成>>=。

int val = 1;
val = val >> 2;

// 简写为
val >>= 2;

1.6.7 运算符优先级

优先级指的是，如果一个表达式包含多个运算符，哪个运算符应该优先执行。各种运算符的优先级是不一样的。

3 + 4 * 5;

上面示例中，表达式3 + 4 * 5里面既有加法运算符（+），又有乘法运算符（*）。由于乘法的优先级高于加法，所以会先计算4 * 5，而不是先计算3 + 4。

如果两个运算符优先级相同，则根据运算符是左结合，还是右结合，决定执行顺序。大部分运算符是左结合（从左到右执行），少数运算符是右结合（从右到左执行），比如赋值运算符（=）。

5 * 6 / 2;

上面示例中，*和/的优先级相同，它们都是左结合运算符，所以从左到右执行，先计算5 * 6，再计算30 / 2。

运算符的优先级顺序很复杂。下面是部分运算符的优先级顺序（按照优先级从高到低排列）。

圆括号（()）
自增运算符（++），自减运算符（--）
一元运算符（+和-）
乘法（*），除法（/）
加法（+），减法（-）
关系运算符（<、>等）
赋值运算符（=）

由于圆括号的优先级最高，可以使用它改变其他运算符的优先级。

int x = (3 + 4) * 5;

上面示例中，由于添加了圆括号，加法会先于乘法进行运算。

完全记住所有运算符的优先级没有必要，解决方法是多用圆括号，防止出现意料之外的情况，也有利于提高代码的可读性。

1.6.8 sizeof运算符

sizeof是 C 语言提供的一个运算符，返回某种数据类型或某个值占用的字节数量。它的参数可以是数据类型的关键字，也可以是变量名或某个具体的值。

// 参数为数据类型
int x = sizeof(int);

// 参数为变量
int i;
sizeof(i);

// 参数为数值
sizeof(3.14);

上面的第一个示例，返回得到int类型占用的字节数量（通常是4或8）。第二个示例返回整数变量占用字节数量，结果与前一个示例完全一样。第三个示例返回浮点数3.14占用的字节数量，由于浮点数的字面量一律存储为 double 类型，所以会返回8，因为 double 类型占用的8个字节。

sizeof运算符的返回值，C 语言只规定是无符号整数，并没有规定具体的类型，而是留给系统自己去决定，sizeof到底返回什么类型。不同的系统中，返回值的类型有可能是unsigned int，也有可能是unsigned long，甚至是unsigned long long，对应的printf()占位符分别是%u、%lu和%llu。这样不利于程序的可移植性。

C 语言提供了一个解决方法，创造了一个类型别名size_t，用来统一表示sizeof的返回值类型。该别名定义在stddef.h头文件（引入stdio.h时会自动引入）里面，对应当前系统的sizeof的返回值类型，可能是unsigned int，也可能是unsigned long。

C 语言还提供了一个常量SIZE_MAX，表示size_t可以表示的最大整数。所以，size_t能够表示的整数范围为[0, SIZE_MAX]。

printf()有专门的占位符%zd或%zu，用来处理size_t类型的值。

printf("%zd\n", sizeof(int));

上面代码中，不管sizeof返回值的类型是什么，%zd占位符（或%zu）都可以正确输出。

如果当前系统不支持%zd或%zu，可使用%u（unsigned int）或%lu（unsigned long int）代替。