《嗨翻C语言》(上)

2016/2/23 14:41:06

《嗨翻C语言》,本书分为三个部分。

本书分为三个部分:第 1 章到第 4 章是基础知识,包括基本语法、指针、字符串、小工具和源文件;第 5 章到第 8 章为进阶内容,有结构、联合、数据结构、堆、函数指针、动/静态链接;最后四章是高级主题,内容涵盖了系统调用、进程间通信、网络编程和多线程。(加粗部分的笔记在下篇)

以下笔记没有严格按照章节进行整理,因为书中在多个章节可能提到同一类知识点,比如(略)

说明

在此笔记中,不记录不同 C 标准的差异,具体细节查看原书;不记录不同 OS 下编写 C 时的差异,具体细节查看原书或者 google。笔记中只对不同标准、不同 OS 下共性的语言原理、语法细节做出整理。

此上篇整理了 1-190 项标注和笔记。

课外

三种C标准

ANSI C 始于 20 世纪 80 年代后期,适用于最古老的代码;1999 年开始的 C99 标准有了很大的改进;在 2011 年发布的最新标准 C11 中……想知道编译器支持哪种标准,可以查看编译器的文档。

“指定初始化器”按名设置结构和联合字段,它属于 C99 标准;

C99 标准支持“指定初始化器”,C++ 不支持。

在代码中间的位置声明新变量,只有 C99 和 C11 标准才允许这样做,在 ANSI C(在此特指 C89)中,必须在函数的顶部声明局部变量;

更多的区别:1. 在早期的 ANSI C 标准中,main() 函数可以是 void 类型。但是在 C99 中 main 函数的返回类型必须是 int。2. ANSI C标准没有用来表示真和假的值,C语言把0这个值当做假处理,把非0的任何值当做真处理。C99标准则允许在程序中使用true和false关键字。但编译器还是会把他们当做1和0这两个值来处理。

扩展阅读:

gcc

gcc 是 *inux 下的一款编译器,上述三种标准它都支持。

ps 这种说法太笼统,请阅读 GCC对C标准的支持GCC的默认C标准哪个版本的gcc才支持c11有哪些支持C11标准的编译器

  • 在不指定C标准的情况下,GCC默认使用GNU C,所以如果你想让编译器遵循C99标准,需要使用 -std=99 选项。
  • gcc是到了4.7,才真正支持c11的。

windows下使用gcc

虽然在本书中作者提供了以下两种方法,但是在后续的介绍中也多有提及其不足之处。而且在接触之后,我还是放弃了 Cygwin,转而在虚拟机上安装了 debian。

如在Windows操作系统上使用gcc(GNU编译器套装),有两种选择:一种是 Cygwin,它可以完全模拟UNIX环境,自然也就包括了gcc;如果你只是想创建能够在Windows下运行的程序,MinGW 可能更符合你的需要。

摘两条在书中描述的 Cygwin 项目不完美的地方:

一些Cygwin的gcc版本允许修改字符串字面值,不会报错,但这样做常常是错的。

Cygwin的很多版本中,在多个信号的发送顺序和接收顺序问题上,做了不恰当的假设。

其他

面向对象是一种对抗软件复杂性的技术。

基础知识

表达式

  • 在C语言中,几乎每样东西都有返回值:表达式 x = 4 本身也有一个值,这个值是4,即赋给x的值。

    Q1:这个赋值表达式能否进行再次赋值?例如 (x=3)=4

    A1:在C中编译无法通过,类似3=4;在C++中正常编译,运行,类似x=4

    注意:以下这种再次赋值是成立的。因为无论 y=4(C语言) 还是 y=x(C++) 都是成立的。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    int main()
    {
    int x = 9;
    int y = 8;
    // 方式一
    y = x = 4;
    // or 两者意义相同
    // y = (x = 4);
    printf("x is %d, y is %d\n", x, y);
    return 0
    }

    关键是理解 C/C++ 中左值的概念,而且 C 和 C++ 中是不一样的。

  • 使用 switch 语句的好处之一是,可以用下落逻辑在不同的分支之间复用代码。

存储器

如果真的想玩转C语言,就需要理解C语言如何操纵存储器。掌握指针和存储器寻址对成为一名地道的C程序员很重要。

函数(例如 main() 函数)中声明变量,计算机会把它保存在一个叫栈(Stack)的存储器区段中;函数以外的地方声明变量,计算机则会把它保存在存储器的全局量段(Globals);堆用于动态存储。

存储器的分布图:参考位置#1022、位置#1322、位置#1448

  • 存储器是进程的
  • sizeof 是运算符,好比+&,它不是库函数。程序是在编译期间计算 sizeof 的。sizeof 运算告知某样东西在存储器中占多少字节,既可以对数据类型使用,也可以对某条数据使用。

指针

  • 指针就是存储器中某条数据的地址
  • 指针做了两件事:避免副本和共享数据。
  • 指针是一种间接形式的地址(怎么理解?)
  • * 运算符可以读取存储器地址中的内容。* 运算符还可以设置存储器地址中的内容。

字符串

  • 指向字符串字面值(string literal)的指针变量不能用来修改字符串的内容

    • 在存储器的非只读区域创建了字符串的副本,就可以修改它的字母

    • 如果你想把指针设成字符串字面值,必须确保使用了 const 关键字:

      1
      2
      3
      // bus error 运行时崩溃
      char *card = "JQK";
      card[1] = 'A';

      编译错误,比在运行时崩溃好太多了!

      1
      2
      3
      // 编译不通过
      const char *s = "some string";
      s[0] = 'S';
    • 加不加 const,字符串字面值都是只读的,const 修饰符表示,一旦你试图用 const 修饰过的变量去修改数组,编译器就会报错

      1
      2
      3
      4
      // 通过jimmy 修改内容就会报编译错误,
      // 但是通过masked_raider 修改就可以成功。
      char masked_raider[] = "Alive";
      const char *jimmy = masked_raider;

数组

  • 数组的索引值是一个偏移量

  • 数组变量好比指针……

    1
    char quote[] = "Cookies make you fat";

    计算机为字符串的每一个字符以及结束字符 \0 在栈上分配空间,并把首字符的地址和 quote 变量关联起来。函数传参时传给函数的是指针。

  • 数组变量与指针又不完全相同(区别:重点理解2、3点)

    1. sizeof(数组) 是……数组的大小;sizeof(指针) 返回4或8。

    2. 数组的地址……是数组的地址;指针的地址是另一个地址。

      1
      2
      &s == s;  // 数组变量
      &t != t; // 指针
    3. 数组变量不能指向其他地方。
      计算机会为数组分配存储空间,但不会为数组变量分配任何空间。

  • 指针退化

    把数组赋给指针变量,指针变量只会包含数组的地址信息,而对数组的长度一无所知,相当于指针丢失了一些信息。我们把这种信息的丢失称为退化。

结构(结构体)

  • 结构可以像数组那样在结构中保存字段,但读取时只能按名访问。

    Q1:数组变量就是一个指向数组的指针,那么结构变量是一个指向结构的指针吗?

    A1:不是,结构变量是结构本身的名字。 数组变量的地址是数组变量自身;结构变量的地址是指针,不是自身。

  • 为结构变量赋值相当于叫计算机复制数据。

    重点在函数传参时很可能浪费较多存储资源;而数组作为函数参数传的是指针。

  • typedef 为结构创建别名。用 typedef 定义结构时可以省略结构名,只写类型名。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    // 定义结构体
    struct call_phone {
    int cell_no;
    const char *wallpaper;
    float minutes_of_charge;
    };
    // 创建别名
    typedef struct call_phone {
    int cell_no;
    const char *wallpaper;
    float minutes_of_charge;
    } phone;
    // 省略结构名
    typedef struct {
    int cell_no;
    const char *wallpaper;
    float minutes_of_charge;
    } phone;
  • 关于“对齐”,可以查看原文或者进一步从网上学习

  • 在C语言中,参数按值传递给函数。

    作者要表达的就是字面意思!@但这句话在国内出版物中经常作为前半句出现—“值传参和“指针传参”,以至于之前理解都有偏差。其实“指针传参”还是按值传递给函数的。

联合

  • 定义一种叫“量”的数据类型,然后根据特定的数据决定要保存个数、重量还是容积。

  • 每次创建结构实例,计算机都会在存储器中相继摆放字段,联合则不同。当定义联合时,计算机以其中最大的字段分配空间,然后由你决定里面保存什么值。

    1
    2
    3
    4
    5
    typedef union {
    short count;
    float weight;
    float volume;
    } quantity;
  • 指定初始化器(designated initializer)按名设置结构和联合字段,它属于C99标准

    1
    2
    quantity q = {.weight=1.5};
    phone p= {.cell_no=15210, .minutes_of_charge=1.2};

    联合提供了一种让你创建支持不同数据类型的变量的方法。

  • 联合经常和结构一起用。创建联合相当于创建新的数据类型。

  • 编译器不会记录你在联合中设置或读取过哪些字段。

    Q1:可以在 union 中保存任何字段(countweight 或者 volume)的值,这些不同类型的值保存在存储器中相同的位置……既然如此,你怎么知道我保存的是 float 还是 short?要是我保存了 float 字段,却读取了 short 字段呢?

    A1:解决方法:只要用枚举或其他东西记录一下就行了。

枚举

(略)

位字段

  • 位字段(bitfield)的初衷是节省存储器空间:真/假的值只需要一位就能表示;月份等小范围的数字……

  • 只有当多个位字段出现在同一个结构中,才能节省空间。

    如果编译器发现结构中只有一个位字段,还是会把它填充成一个字,这就是为什么位字段总是组合在一起。

  • 可以用位字段指定一个字段有多少位。位字段应当声明为 unsigned int

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    typedef struct {
    // 是否第一次参观?
    unsigned int first_visit:1;
    // 还会再来吗?
    unsigned int come_agin:1;
    // 被咬掉了几根手指?
    unsigned int fingers_lost:4;
    // 被鲨鱼袭击过吗?
    unsigned int shark_attack:1;
    // 一周来几天?
    unsigned int days_a_week:3;
    } survey;

Q1:为什么C语言不支持二进制字面值?

A1:因为二进制字面值占了很大空间(质疑?),而且十六进制通常写起来更快。

递归

  • 为了保存可变数量的数据,需要一样比数组更灵活的东西,即链表。

    链表是一种抽象数据结构。链表是通用的,可以用来保存很多不同类型的数据,所以被称之为抽象数据结构。

  • 与数组相比,链表还有一个优点:插入数据非常快。

    Q1:如何在C语言中创建链表?

    A1:通过创建递归结构实现。

  • 如果一个结构包含一个链向同种结构的链接,那么这个结构就被称为递归结构。

    在递归结构中,需要包含一个相同类型的指针,C语言的语法不允许用typedef别名来声明它。个人猜测,应该和声明顺序有关。毕竟如果 typedef 新类型 newtype,然后 newtype * pointer 创建指针,是可行的。

    1
    2
    3
    4
    5
    6
    7
    // 在递归结构中,必须为结构体命名。别名可选
    typedef struct island {
    char *name;
    char *opens;
    char *closes;
    struct island *next; // 此处不允许使用别名来声明
    } island;

    C语言需要知道结构在存储器中占的具体大小,如果在结构中递归地复制它自己,那么两条数据就会不一样大。指针的大小是确定的。

  • 在C语言中,NULL 的值实际上为0

分而治之

小工具

问:什么是小工具?——其实就是其字面意思,重点是要有这个概念。

操作系统都有小工具。类Unix的操作系统为完成工作会大量使用工具,Windows用的少一些。

C语言小工具执行特定的小任务,例如读写文件、过滤数据。如果要完成更复杂的任务,可以把多个工具链接在一起。

小工具是一个C程序,它做一件事情并把它做好。

当你想解决一个大问题时,可以把它分解成一连串的小问题,然后针对每个小问题写一个小工具。

问:为什么小工具要使用标准输入和标准输出?

答:有了它们,就可以轻易用管道将小工具们串连起来。

问:如果两个程序用管道相连,第二个程序要不要等第一个程序执行完后才能开始运行?

答:不需要,两个程序可以同时运行,第一个程序一发出数据,第二个程序马上就可以处理。

输入输出

  • 使用 scanf() 时要小心:限制 scanf() 能读入的字符数

    1
    2
    3
    4
    5
    6
    7
    8
    9
    // 注意字符数组的长度,和scanf 读取的限制
    int main()
    {
    char card_name[3];
    puts("输入牌名:");
    scanf("%2s", card_name);
    // other code
    return 0;
    }

    如果忘了限制 scanf() 读取字符串的长度,用户就可以输入远远超出程序空间的数据,多余的数据会写到计算机还没有分配好的存储器中

  • 如果你要向 fgets() 函数传递数组变量,就用 sizeof;如果只是传指针,就应该输入你想要的长度。

  • 操作系统控制数据如何进出标准输入、标准输出。

  • scanf()printf() 函数,只管从标准输入读数据,向标准输出写数据

  • 进程有一只耳朵(标准输入)和两张嘴(标准输出和标准错误)

  • printf() 其实只是 fprintf() 函数的特例,

  • 可以用 > 重定向标准输出,2> 重定向标准错误。

  • 用管道连接输入与输出

创建自己的数据流

  • 程序运行时,操作系统会为它创建三条数据流:标准输入、标准输出和标准错误。但有时你需要创建自己的数据流。

    每条数据流用一个指向文件的指针来表示,可以用 fopen() 函数创建新数据流。

    创建数据流后,可以用 fprintf() 函数往数据流中打印数据;可以用 fscanf() 函数从数据流中读取数据。

    当用完数据流,别忘了使用 fclose() 函数关闭它。

  • 虽然所有的数据流在程序结束后都会自动关闭,但你仍应该自己关闭它们:

命令行参数

  • 十个程序有九个需要选项。聊天程序有“系统设置”,游戏有调整难度的选项,而命令行工具需要有命令行选项。

    很多程序都会用到命令行选项,因此有一个专门的库函数,可以使用它来简化处理流程。这个库函数叫做 getopt(),每一次调用都会返回命令行中下一个参数。

    有关函数的具体使用方法,翻阅原书或者 google 都行。

  • unistd.h头文件不属于C标准库,而是POSIX库中的一员。POSIX的目标是创建一套能够在所有主流操作系统上使用的函数。

使用多个源文件

  • 当编译器看到尖括号,就会到标准库代码所在目录查找头文件;用引号把文件名括起来,编译器就会在本地查找文件。

  • C语言是一种很小的语言,共有32+n个保留字。以下列出部分:

    auto register static extern typedef union volatile

  • 使用头文件

    • (函数)声明与定义分离

      将声明和定义分离之后也不用再严格调整函数定义之间的顺序。

      把声明放到一个独立的头文件中有两大优点,第一是主代码变短了,第二可以共享代码(被两个以上源文件 include 时)。

    • 如此,就可以在不同的文件之间共享函数了,但如果你想共享变量呢?

      为了防止两个源文件中的同名变量相互干扰,变量的作用域仅限于某个文件内。如果你想共享变量,就应该在头文件中声明,并在变量名前加上 extern 关键字(需要进一步的学习):

      ps:原文表述不太恰当。改为:

      1. 为了防止两个源文件中的同名变量相互干扰,变量的作用域仅限于某个文件内——(这句话存在异议,使用 gcc 实际编译时不同文件使用同名变量会报错“重复定义”)。
      2. 如果你想共享变量,就应该在头文件中声明。——声明变量,即在变量名前使用 extern 关键字,不应该用“并”。
      3. 关于 extern,见《进一步学习extern》笔记。

动态存储

  • ——另起篇幅