说到super, 大家可能觉得很简单呀,不就是用来调用父类方法的嘛。如果真的这么简单的话也就不会有这篇文章了,且听我细细道来。
在开始之前我们来约定一下本文所使用的 Python 版本。默认用的是 Python 3,也就是说:本文所定义的类都是新式类。如果你用到是 Python 2 的话,记得继承object:
- # 默认, Python 3
- class A:
- pass
-
- # Python 2
- class A(object):
- pass
Python 3 和 Python 2 的另一个区别是: Python 3 可以使用直接使用super().xxx代替super(Class, self).xxx:
- # 默认,Python 3
- class B(A):
- def add(self, x):
- super().add(x)
-
- # Python 2
- class B(A):
- def add(self, x):
- super(B, self).add(x)
所以,你如果用的是 Python 2 的话,记得将本文的super()替换为suepr(Class, self)。
如果还有其他不兼容 Python 2 的情况,我会在文中注明的。
在单继承中super就像大家所想的那样,主要是用来调用父类的方法的。
- class A:
- def __init__(self):
- self.n = 2
-
- def add(self, m):
- print('self is {0} @A.add'.format(self))
- self.n += m
-
-
- class B(A):
- def __init__(self):
- self.n = 3
-
- def add(self, m):
- print('self is {0} @B.add'.format(self))
- super().add(m)
- self.n += 3
你觉得执行下面代码后,b.n的值是多少呢?
- b = B()
- b.add(2)
- print(b.n)
执行结果如下:
- self is <__main__.B object at 0x106c49b38> @B.add
- self is <__main__.B object at 0x106c49b38> @A.add
- 8
这个结果说明了两个问题:
不知道这个结果是否和你想到一样呢?下面我们来看一个多继承的例子。
这次我们再定义一个class C,一个class D:
- class C(A):
- def __init__(self):
- self.n = 4
-
- def add(self, m):
- print('self is {0} @C.add'.format(self))
- super().add(m)
- self.n += 4
-
-
- class D(B, C):
- def __init__(self):
- self.n = 5
-
- def add(self, m):
- print('self is {0} @D.add'.format(self))
- super().add(m)
- self.n += 5
下面的代码又输出啥呢?
- d = D()
- d.add(2)
- print(d.n)
这次的输出如下:
- self is <__main__.D object at 0x10ce10e48> @D.add
- self is <__main__.D object at 0x10ce10e48> @B.add
- self is <__main__.D object at 0x10ce10e48> @C.add
- self is <__main__.D object at 0x10ce10e48> @A.add
- 19
你说对了吗?你可能会认为上面代码的输出类似:
- self is <__main__.D object at 0x10ce10e48> @D.add
- self is <__main__.D object at 0x10ce10e48> @B.add
- self is <__main__.D object at 0x10ce10e48> @A.add
- 15
为什么会跟预期的不一样呢?下面我们将一起来看看super的奥秘。
当我们调用super()的时候,实际上是实例化了一个super类。你没看错,super是个类,既不是关键字也不是函数等其他数据结构:
- >>> class A: pass
- ...
- >>> s = super(A)
- >>> type(s)
- <class 'super'>
- >>>
在大多数情况下,super包含了两个非常重要的信息: 一个 MRO 以及 MRO 中的一个类。当以如下方式调用super时:
- super(a_type, obj)
MRO指的是type(obj)的 MRO, MRO 中的那个类就是a_type, 同时isinstance(obj, a_type) == True。
当这样调用时:
- super(type1, type2)
MRO 指的是type2的MRO,MRO中的那个类就是type1,同时issubclass(type2, type1) == True。
那么,super()实际上做了啥呢?简单来说就是:提供一个MRO以及一个MRO中的类C,super()将返回一个从MRO中C之后的类中查找方法的对象。
也就是说,查找方式时不是像常规方法一样从所有的MRO类中查找,而是从MRO的 tail 中查找。
举个例子, 有个MRO:
- [A, B, C, D, E, object]
下面的调用:
- super(C, A).foo()
super只会从C之后查找,即: 只会在D或E或object中查找foo方法。
再回到前面的
- d = D()
- d.add(2)
- print(d.n)
现在你可能已经有点眉目,为什么输出会是
- self is <__main__.D object at 0x10ce10e48> @D.add
- self is <__main__.D object at 0x10ce10e48> @B.add
- self is <__main__.D object at 0x10ce10e48> @C.add
- self is <__main__.D object at 0x10ce10e48> @A.add
- 19
了吧 ;)
下面我们来具体分析一下:
- class A:
- def __init__(self):
- self.n = 2
-
- def add(self, m):
- # 第四步
- # 来自 D.add 中的 super
- # self == d, self.n == d.n == 5
- print('self is {0} @A.add'.format(self))
- self.n += m
- # d.n == 7
-
-
- class B(A):
- def __init__(self):
- self.n = 3
-
- def add(self, m):
- # 第二步
- # 来自 D.add 中的 super
- # self == d, self.n == d.n == 5
- print('self is {0} @B.add'.format(self))
- # 等价于 suepr(B, self).add(m)
- # self 的 MRO 是 [D, B, C, A, object]
- # 从 B 之后的 [C, A, object] 中查找 add 方法
- super().add(m)
-
- # 第六步
- # d.n = 11
- self.n += 3
- # d.n = 14
-
- class C(A):
- def __init__(self):
- self.n = 4
-
- def add(self, m):
- # 第三步
- # 来自 B.add 中的 super
- # self == d, self.n == d.n == 5
- print('self is {0} @C.add'.format(self))
- # 等价于 suepr(C, self).add(m)
- # self 的 MRO 是 [D, B, C, A, object]
- # 从 C 之后的 [A, object] 中查找 add 方法
- super().add(m)
-
- # 第五步
- # d.n = 7
- self.n += 4
- # d.n = 11
-
-
- class D(B, C):
- def __init__(self):
- self.n = 5
-
- def add(self, m):
- # 第一步
- print('self is {0} @D.add'.format(self))
- # 等价于 super(D, self).add(m)
- # self 的 MRO 是 [D, B, C, A, object]
- # 从 D 之后的 [B, C, A, object] 中查找 add 方法
- super().add(m)
-
- # 第七步
- # d.n = 14
- self.n += 5
- # self.n = 19
-
- d = D()
- d.add(2)
- print(d.n)
调用过程图如下:
- D.mro() == [D, B, C, A, object]
- d = D()
- d.n == 5
- d.add(2)
-
- class D(B, C): class B(A): class C(A): class A:
- def add(self, m): def add(self, m): def add(self, m): def add(self, m):
- super().add(m) 1.---> super().add(m) 2.---> super().add(m) 3.---> self.n += m
- self.n += 5 <------6. self.n += 3 <----5. self.n += 4 <----4. <--|
- (14+5=19) (11+3=14) (7+4=11) (5+2=7)
现在你知道为什么 d.add(2) 后 d.n 的值是 19 了吧 ;)