引用在本质上是什么，它和指针到底有什么区别

时间：01-05来源：作者：点击数：728

通过上节的讲解，相信各位读者对引用都有了一个概念上的认识，能够简单地使用引用编程了，但又感觉糊里糊涂，不明白它到底是什么，它和指针有点相似，但又不是一个东西。

首先来回顾一下上节的例子：

#include <iostream>
using namespace std;
int main(){
    int a = 99;
    int &b = a;
    cout<<a<<", "<<b<<endl;
    cout<<&a<<", "<<&b<<endl;
    return 0;
}

运行结果：

99, 99
0x28ff44, 0x28ff44

我们知道，变量是要占用内存的，虽然我们称 b 为变量，但是通过&b获取到的却不是 b 的地址，而是 a 的地址，这会让我们觉得 b 这个变量不占用独立的内存，它和 a 指代的是同一份内存。

请读者再继续看下面的例子：

#include <iostream>
#include <iomanip>
using namespace std;
int num = 99;
class A{
public:
    A();
private:
    int n;
    int &r;
};
A::A(): n(0), r(num){}
int main (){
    A *a = new A();
    cout<<sizeof(A)<<endl;  //输出A类型的大小
    cout<<hex<<showbase<<*((int*)a + 1)<<endl;  //输出r的内容
    cout<<&num<<endl;  //输出num变量的地址
    return 0;
}

运行结果：

8
0x442000
0x442000

成员变量 r 是 private 属性的，不能直接通过对象来访问，但是借助强大的指针和类型转换，我们依然可以得到它的内容，只不过这种方法有点蹩脚，我们将在《突破访问权限的限制（C++ Hack）》一节中详细阐述，读者暂时不必理解，只要知道第 20 行代码是用来输出 r 的内容的即可。

第 20 行代码中，hex表示以十六进制输出，showbase表示添加十六进制前缀0x。

从运行结果可以看出：

成员变量 r 是占用内存的，如果不占用的话，sizeof(A)的结果应该为 4。
r 存储的内容是0x442000，也即变量 num 的地址。

这说明 r 的实现和指针非常类似。如果将 r 定义为int *类型的指针，并在构造函数中让它指向 num，那么 r 占用的内存也是 4 个字节，存储的内容也是 num 的地址。

其实引用只是对指针进行了简单的封装，它的底层依然是通过指针实现的，引用占用的内存和指针占用的内存长度一样，在 32 位环境下是 4 个字节，在 64 位环境下是 8 个字节，之所以不能获取引用的地址，是因为编译器进行了内部转换。以下面的语句为例：

int a = 99;
int &r = a;
r = 18;
cout<<&r<<endl;

编译时会被转换成如下的形式：

int a = 99;
int *r = &a;
*r = 18;
cout<<r<<endl;

使用&r取地址时，编译器会对代码进行隐式的转换，使得代码输出的是 r 的内容（a 的地址），而不是 r 的地址，这就是为什么获取不到引用变量的地址的原因。也就是说，不是变量 r 不占用内存，而是编译器不让获取它的地址。

当引用作为函数参数时，也会有类似的转换。以下面的代码为例：

//定义函数
void swap(int &a, int &b){
    int temp = a;
    a = b;
    b = temp;
}
//调用函数
int num1 = 10, num2 = 20;
swap(num1, num2);

编译时会被转换成如下的形式：

//定义函数
void swap(int *a, int *b){
    int temp = *a;
    *a = *b;
    *b = temp;
}
//调用函数
int num1 = 10, num2 = 20;
swap(&num1, &num2);

引用虽然是基于指针实现的，但它比指针更加易用，从上面的两个例子也可以看出来，通过指针获取数据时需要加*，书写麻烦，而引用不需要，它和普通变量的使用方式一样。

C++ 的发明人 Bjarne Stroustrup 也说过，他在 C++ 中引入引用的直接目的是为了让代码的书写更加漂亮，尤其是在运算符重载中，不借助引用有时候会使得运算符的使用很麻烦。

引用和指针的其他区别

1) 引用必须在定义时初始化，并且以后也要从一而终，不能再指向其他数据；而指针没有这个限制，指针在定义时不必赋值，以后也能指向任意数据。

2) 可以有 const 指针，但是没有 const 引用。也就是说，引用变量不能定义为下面的形式：

int a = 20;
int & const r = a;

因为 r 本来就不能改变指向，加上 const 是多此一举。

3) 指针可以有多级，但是引用只能有一级，例如，int **p是合法的，而int &&r是不合法的。如果希望定义一个引用变量来指代另外一个引用变量，那么也只需要加一个&，如下所示：

int a = 10;
int &r = a;
int &rr = r;

4) 指针和引用的自增（++）自减（--）运算意义不一样。对指针使用 ++ 表示指向下一份数据，对引用使用 ++ 表示它所指代的数据本身加 1；自减（--）也是类似的道理。请看下面的例子：

#include <iostream>
using namespace std;
int main (){
    int a = 10;
    int &r = a;
    r++;
    cout<<r<<endl;
   
    int arr[2] = { 27, 84 };
    int *p = arr;
    p++;
    cout<<*p<<endl;
    return 0;
}