2025年4月3日星期四乙巳(蛇)年正月初四设为首页加入收藏

进入网站首页面

掌上城东书院
定制您的专属资源库
m.cdsy.xyz

掌上城东书院
随时随地，想看就看

关注我们

首页

您当前的位置：首页 > 计算机 > 编程开发 > VC/VC++

那些被编译器隐藏了的过程

时间：03-07来源：作者：点击数：353

对于平常应用程序的开发，很少有人会关注编译和链接的过程，因为我们使用的工具一般都是流行的集成开发环境（IDE），比如 Visual Studio、Dev C++、C-Free 等。这些功能强大的 IDE 通常将编译和链接合并到一起，也就是构建（Build）或运行（Run）。即使在 Linux 下使用命令行来编译一个源文件，简单的一句$gcc demo.c也包含了非常复杂的过程。

虽然 IDE 提供的默认配置、编译和链接参数对于大部分应用程序来说已经足够使用了，但是作为学习者，我们还是要刨根问底，弄清从源代码生成可执行文件的内部机理，不要被 IDE 提供的强大功能所迷惑。

C语言经典的“Hello World”小程序几乎是每个程序员闭着眼睛都能写出来的，基本成了入门教程和开发环境的默认标准，代码如下：

#include <stdio.h>
int main(){
    printf("Hello World\n");
    return 0;
}

如果在 Windows 下使用 Visual Studio 来编译，那么可以直接点击运行（Run）按钮或者构建（Build）按钮，在工程目录下就会看到生成的 .exe 程序。

如果在 Linux 下使用 GCC 来编译，使用最简单的$gcc demo.c命令，就可以在当前目录下看到 a.out。

事实上，从源代码生成可执行文件可以分为四个步骤，分别是预处理（Preprocessing）、编译（Compilation）、汇编（Assembly）和链接（Linking）。下图是 GCC 生成 a.out 的过程：

预处理（Preprocessing）

预处理过程主要是处理那些源文件和头文件中以#开头的命令，比如 #include、#define、#ifdef 等。预处理的规则一般如下：

将所有的#define删除，并展开所有的宏定义。
处理所有条件编译命令，比如 #if、#ifdef、#elif、#else、#endif 等。
处理#include命令，将被包含文件的内容插入到该命令所在的位置，这与复制粘贴的效果一样。注意，这个过程是递归进行的，也就是说被包含的文件可能还会包含其他的文件。
删除所有的注释//和/* ... */。
添加行号和文件名标识，便于在调试和出错时给出具体的代码位置。
保留所有的#pragma命令，因为编译器需要使用它们。

预处理的结果是生成.i文件。.i文件也是包含C语言代码的源文件，只不过所有的宏已经被展开，所有包含的文件已经被插入到当前文件中。当你无法判断宏定义是否正确，或者文件包含是否有效时，可以查看.i文件来确定问题。

在 GCC 中，可以通过下面的命令生成.i文件：

$gcc -E demo.c -o demo.i

-E表示只进行预编译。

在 Visual Studio 中，在当前工程的属性面板中将“预处理到文件”设置为“是”，如下图所示：

然后点击“运行（Run）”或者“构建（Build）”按钮，就能在当前工程目录中看到 demo.i 。

编译（Compilation）

编译就是把预处理完的文件进行一些列的词法分析、语法分析、语义分析以及优化后生成相应的汇编代码文件。编译是整个程序构建的核心部分，也是最复杂的部分之一，涉及到的算法较多，我们并不打算深入讨论，有兴趣的读者请查看《编译原理》。

在 GCC 中，可以使用下面的命令生成.s文件：

$gcc -S demo.i -o demo.s

或者

$gcc -S demo.c -o demo.s

在 Visual Studio 中，不用进行任何设置就可以在工程目录下看到 demo.asm 文件。

汇编（Assembly）

汇编的过程就是将汇编代码转换成可以执行的机器指令。大部分汇编语句对应一条机器指令，有的汇编语句对应多条机器指令，我们在《C语言内存精讲》中的《一个程序在计算机中到底是如何运行的》一节对汇编语言进行了简单的解释。

汇编过程相对于编译来说比较简单，没有复杂的语法，也没有语义，也不需要做指令优化，只是根据汇编语句和机器指令的对照表一一翻译就可以了。

汇编的结果是产生目标文件，在 GCC 下的后缀为.o，在 Visual Studio 下的后缀为.obj。

链接（Linking）

目标文件已经是二进制文件，与可执行文件的组织形式类似，只是有些函数和全局变量的地址还未找到，程序不能执行。链接的作用就是找到这些目标地址，将所有的目标文件组织成一个可以执行的二进制文件。

预处理和汇编的过程都比较简单，有了上面的介绍，相信大家很容易理解。

编译的过程最为复杂，可以细分为词法分析、语法分析、语义分析和指令优化，这里涉及到诸多算法以及正则表达式，我们并不打算深入分析，也没必要，有兴趣的读者请自行查阅《编译原理》。

而目标文件的结构、可执行文件的结构、链接的过程是我们要重点研究的，它能够让我们明白多文件编程以及模块化开发的原理，这是大型项目开发的基石。

最后需要说明的是：汇编的过程非常简单，仅仅是查表翻译，我们通常把它作为编译过程的一部分，不再单独提及。这样，源文件经过预处理、编译和链接就生成了可执行文件。

方便获取更多学习、工作、生活信息请关注本站微信公众号 城东书院微信服务号

城东书院微信服务号

城东书院微信订阅号

5

上一篇:C++常量成员函数下一篇:C++ share_ptr智能指针使用详解

推荐内容

高考生入学注意：这些大	【健康】纯净水、天然
14种竞赛生升学路径盘	excel后缀xls和xlsx有

相关内容

栏目更新

栏目热门

关于我们 | 联系我们 | 用户协议 | 广告服务 | 申请链接 | 网站地图 | 版权声明 | 用户留言 | 招聘信息 | 帮助中心 | 社区讨论 | 下载服务

中国文明网传播文明

Copyright ©2019-2024 CDSY Corporation, All Rights Reserved

城东书院^® CDSY.XYZ 版权所有湘ICP备19021508号-1 公安网备案

公安网备案

湘公网安备 43102202000103号

※学习、工作、生活信息平台※

无事常如有事时，提防才可以弥意外之变；有事常如无事时，镇定方可以消局中之危。 —菜根谭

本网大部分资源来源于会员上传，除本网组织的资源外，版权归原作者所有，如有侵犯版权，请立刻和本网联系并提供证据，本网将在三个工作日内改正。