[Python之路] object类中的特殊方法

2023-06-05,,

一、object类的源码

python版本:3.8

class object:
""" The most base type """ # del obj.xxx或delattr(obj,'xxx')时被调用,删除对象中的一个属性
def __delattr__(self, *args, **kwargs): # real signature unknown
""" Implement delattr(self, name). """
pass # 对应dir(obj),返回一个列表,其中包含所有属性和方法名(包含特殊方法)
def __dir__(self, *args, **kwargs): # real signature unknown
""" Default dir() implementation. """
pass # 判断是否相等 equal ,在obj==other时调用。如果重写了__eq__方法,则会将__hash__方法置为None
def __eq__(self, *args, **kwargs): # real signature unknown
""" Return self==value. """
pass # format(obj)是调用,实现如何格式化obj对象为字符串
def __format__(self, *args, **kwargs): # real signature unknown
""" Default object formatter. """
pass # getattr(obj,'xxx')、obj.xxx时都会被调用,当属性存在时,返回值,不存在时报错(除非重写__getattr__方法来处理)。
# 另外,hasattr(obj,'xxx')时也会被调用(估计内部执行了getattr方法)
def __getattribute__(self, *args, **kwargs): # real signature unknown
""" Return getattr(self, name). """
pass # 判断是否大于等于 greater than or equal,在obj>=other时调用
def __ge__(self, *args, **kwargs): # real signature unknown
""" Return self>=value. """
pass # 判断是否大于 greater than,在obj>other时调用
def __gt__(self, *args, **kwargs): # real signature unknown
""" Return self>value. """
pass # 调用hash(obj)获取对象的hash值时调用
def __hash__(self, *args, **kwargs): # real signature unknown
""" Return hash(self). """
pass def __init_subclass__(self, *args, **kwargs): # real signature unknown
"""
This method is called when a class is subclassed. The default implementation does nothing. It may be
overridden to extend subclasses.
"""
pass # object构造函数,当子类没有构造函数时,会调用object的__init__构造函数
def __init__(self): # known special case of object.__init__
""" Initialize self. See help(type(self)) for accurate signature. """
pass # 判断是否小于等于 less than or equal,在obj<=other时调用
def __le__(self, *args, **kwargs): # real signature unknown
""" Return self<=value. """
pass # 判断是否小于 less than,在obj<other时调用
def __lt__(self, *args, **kwargs): # real signature unknown
""" Return self<value. """
pass # 创建一个cls类的对象,并返回
@staticmethod # known case of __new__
def __new__(cls, *more): # known special case of object.__new__
""" Create and return a new object. See help(type) for accurate signature. """
pass # 判断是否不等于 not equal,在obj!=other时调用
def __ne__(self, *args, **kwargs): # real signature unknown
""" Return self!=value. """
pass def __reduce_ex__(self, *args, **kwargs): # real signature unknown
""" Helper for pickle. """
pass def __reduce__(self, *args, **kwargs): # real signature unknown
""" Helper for pickle. """
pass # 如果不重写__str__,则__repr__负责print(obj)和交互式命令行中输出obj的信息
# 如果重写了__str__,则__repr__只负责交互式命令行中输出obj的信息
def __repr__(self, *args, **kwargs): # real signature unknown
""" Return repr(self). """
pass # 使用setattr(obj,'xxx',value)、obj.xxx=value是被调用(注意,构造函数初始化属性也要调用)
def __setattr__(self, *args, **kwargs): # real signature unknown
""" Implement setattr(self, name, value). """
pass # 获取对象内存大小
def __sizeof__(self, *args, **kwargs): # real signature unknown
""" Size of object in memory, in bytes. """
pass # 设置print(obj)打印的信息,默认是对象的内存地址等信息
def __str__(self, *args, **kwargs): # real signature unknown
""" Return str(self). """
pass @classmethod # known case
def __subclasshook__(cls, subclass): # known special case of object.__subclasshook__
"""
Abstract classes can override this to customize issubclass(). This is invoked early on by abc.ABCMeta.__subclasscheck__().
It should return True, False or NotImplemented. If it returns
NotImplemented, the normal algorithm is used. Otherwise, it
overrides the normal algorithm (and the outcome is cached).
"""
pass
# 某个对象是由什么类创建的,如果是object,则是type类<class 'type'>
__class__ = None
# 将对象中所有的属性放入一个字典,例如{'name':'Leo','age':32}
__dict__ = {}
# 类的doc信息
__doc__ = ''
# 类属于的模块,如果是在当前运行模块,则是__main__,如果是被导入,则是模块名(即py文件名去掉.py)
__module__ = ''

二、常用特殊方法解释

1.__getattribute__方法

1)什么时候被调用

这个特殊方法是在我们使用类的对象进行obj.属性名getattr(obj,属性名)来取对象属性的值的时候被调用。例如:

class Foo(object):
def __init__(self):
self.name = 'Alex' def __getattribute__(self, item):
print("__getattribute__ in Foo")
return object.__getattribute__(self, item) if __name__ == '__main__':
f = Foo()
print(f.name) # name属性存在 或者 getattr(f,name)
print(f.age) # age属性不存在

不管属性是否存在,__getattribute__方法都会被调用。如果属性存在,则返回该属性的值,如果属性不存在,则返回None。

注意,我们在使用hasattr(obj,属性名)来判断某个属性是否存在时,__getattribute__方法也会被调用。

2)与__getattr__的区别

我们在类的实现中,可以重写__getattr__方法,那么__getattr__方法和__getattribute__方法有什么区别??

我们知道__getattribute__方法不管属性是否存在,都会被调用。而__getattr__只在属性不存在时调用,默认会抛出 AttributeError: 'Foo' object has no attribute 'age' 这样的错误,但我们可以对其进行重写,做我们需要的操作:

class Foo(object):
def __init__(self):
self.name = 'Alex' def __getattribute__(self, item):
print("__getattribute__ in Foo")
return object.__getattribute__(self, item) def __getattr__(self, item):
print("%s不存在,但我可以返回一个值" % item)
return 54 if __name__ == '__main__':
f = Foo()
print(f.name) # name属性存在
print(f.age) # age属性不存在,但__getattr__方法返回了54,所以这里打印54。

返回结果:

__getattribute__ in Foo
Alex
__getattribute__ in Foo
age不存在,但我可以返回一个值
54

我们看到,f.name和f.age都调用了__getattribute__方法,但是只有f.age时调用了__getattr__方法。所以,我们可以利用__getattr__做很多事情,例如从类中的一个字典中取值,或者处理异常等。

2.__setattr__方法

当我们执行obj.name='alex'setattr(obj,属性名,属性值),即为属性赋值时被调用。

class Foo(object):
def __init__(self):
self.name = 'Alex' # obj.xxx = value时调用
def __setattr__(self, key, value):
print('setattr')
return object.__setattr__(self, key, value) if __name__ == '__main__':
f = Foo()
f.name = 'Jone' # 打印setattr
print(f.name)

如果__setattr__被重写(不调用父类__setattr__的话)。则使用obj.xxx=value赋值就无法工作了。

特别注意,在类的构造函数中对属性进行初始化赋值时也是调用了该方法:

class Foo(object):
def __init__(self):
self.name = 'Alex' # 这里也要调用__setattr__
  ...

当我们需要重写__setattr__方法的时候,就要注意初始化时要使用object类的__setattr__来初始化:

class Local(object):
def __init__(self):
# 这里不能直接使用self.DIC={},因为__setattr__被重写了
object.__setattr__(self, 'DIC', {}) def __setattr__(self, key, value):
self.DIC[key] = value def __getattr__(self, item):
return self.DIC.get(item, None) if __name__ == '__main__':
obj = Local()
obj.name = 'Alex' # 向DIC字典中存入值
print(obj.name) # 从DIC字典中取出值

3.__delattr__方法

这个方法对应del obj.属性名delattr(obj,属性名)两种操作时被调用。即,删除对象中的某个属性。

if hasattr(f,'xxx'):  # 判断f对象中是否存在属性xxx
delattr(f, 'xxx') # 如果存在则删除。当xxx不存在时删除会报错
# del f.xxx # 同上

4.__dir__方法

对应dir(obj)获取对象中所有的属性名,包括所有的属性和方法名。

f = Foo()
print(f.__dir__()) # ['name', '__module__', '__init__', '__setattr__', '__getattribute__', '__dir__', '__dict__', '__weakref__', '__doc__', '__repr__', '__hash__', '__str__', '__delattr__', '__lt__', '__le__', '__eq__', '__ne__', '__gt__', '__ge__', '__new__', '__reduce_ex__', '__reduce__', '__subclasshook__', '__init_subclass__', '__format__', '__sizeof__', '__class__']

返回一个列表。

5.__eq__和__hash__

__eq__是判断obj==other的时候调用的,默认调用的是object继承下去的__eq__。

f1 = Foo()
f2 = f1
print(f1 == f2) # True
print(f1 is f2) # True
print(hash(f1) == hash(f2)) # True

默认情况下,f1 == f2,f1 is f2,hash(f1)==hash(f2)都应该同时为True(或不相等,同为False)。

如果我们重写了__eq__方法,例如两个对象的比较变成比较其中的一个属性:

class Foo(object):
def __init__(self):
self.name = 'Alex' # 这里也要调用__
self.ccc = object.__class__
def __eq__(self, other):
return self.name==other.name

即,如果self.name==other.name,则认为对象相等。

f1 = Foo()
f2 = Foo()
print(f1 == f2) # True
print(f1 is f2) # False
print(hash(f1) == hash(f2)) # 抛出异常TypeError错误

为什么hash会抛出异常,这是因为如果我们在某个类中重写了__eq__方法,则默认会将__hash__=None。所以,当我们调用hash(obj)时,__hash__方法无法执行。

总结:

当我们实现的类想成为不可hash的类,则可以重写__eq__方法,然后不重写__hash__,__hash__方法会被置None,该类的对象就不可hash了。

默认提供的__hash__方法(hash(obj))对于值相同的变量(类型有限制,有些类型不能hash,例如List),同解释器下hash值相同,而不同解释器下hash值不同。所以,如果我们想要hash一个目标,应该使用hashlib模块

hash和id的区别,理论上值相同的两个对象hash值应该相同,而id可能不同(必须是同一个对象,即内存地址相同,id才相同。id(obj)是obj的唯一标识。)

6.__gt__、__lt__、__ge__、__le__

这几个都是用于比较大小的,我们可以对其进行重写,来自定义对象如何比较大小(例如只比较对象中其中一个属性的值)。

7.__str__和__repr__

__str__用于定义print(obj)时打印的内容。

class Foo(object):
def __init__(self):
self.name = 'Alex' def __str__(self):
return "我是Foo" if __name__ == '__main__':
f1 = Foo()
print(f1) # 打印 我是Foo

在命令行下:

>>> class Foo(object):
... def __str__(self):
... return "我是Foo"
...
>>> f1 = Foo()
>>> print(f1)
我是Foo
>>> f1
<__main__.Foo object at 0x0000023BF701C550>

可以看到,使用__str__的话,print可以打印我们指定的值,而命令行输出则是对象的内存地址。

__repr__用于同时定义python命令行输出obj的内容,以及print(obj)的打印内容(前提是没有重写__str__)。

class Foo(object):
def __init__(self):
self.name = 'Alex' def __repr__(self):
return "我是Foo" if __name__ == '__main__':
f1 = Foo()
print(f1) # 打印 我是Foo

在命令行下:

>>> class Foo(object):
... def __repr__(self):
... return "我是Foo"
...
>>> f1 = Foo()
>>> print(f1)
我是Foo
>>> f1
我是Foo

可以看到,我们只重写了__repr__,但是print和直接输出都打印了我们指定的值。

当我们同时重写__str__和__repr__时:

>>> class Foo():
... def __str__(self):
... return "我是Foo---str"
... def __repr__(self):
... return "我是Foo---repr"
...
>>> f1 = Foo()
>>> print(f1)
我是Foo---str
>>> f1
我是Foo---repr

可以看到,在同时重写两个方法时,__str__负责print的信息,而__repr__负责命令行直接输出的信息。

8.__new__方法

__new__方法是一个静态方法,在调用时,传入你需要实例化的类名以及初始化参数列表。例如:

class Foo(object):
"""
这是一个类,名叫Foo
"""
# 后于__new__方法执行,为__new__方法生成的对象进行初始化
def __init__(self, name, age): # __new__返回的对象作为self传入__init__
print("执行__init__方法")
self.name = name
self.age = age # __new__方法先于__init__方法执行,用于生成一个指定类的对象
def __new__(cls, *args, **kwargs): # 接收参数cls为Foo类,然后从f1 = Foo("Alex",age=32)里的name和age
print("执行__new__方法")
ret = object.__new__(cls) # 调用__new__生成一个Foo对象
print(ret) # 打印<__main__.Foo object at 0x000001AD868F8668>
return ret # 返回生成的Foo对象

注意一下几点:

1)__new__在object被指定为@staticmethod,但更像是一个@classmethod,第一个参数传入类本身cls。

2)__new__在__init__之前运行,为传入的类(Foo)生成一个实例并返回。

3)__init__在__new__之后执行,为__new__返回的类实例进行初始化。

4)__init__是一个实例方法,是由实例来调用的。所以要执行__init__方法,必须先要由__new__生产一个实例。这就是为什么先执行__new__方法的原因。

9.__sizeof__方法

这里注意两个获取占用内存空间的方法,一个就是对象的__sizeof__方法,另一个是sys.getsizeof方法,sys.getsizeof方法中调用了对应对象的__sizeof__方法。

我们通过实验,看看这另个方法有什么不同:

# 不带属性的类
class WithoutAttr(object):
pass # 带属性的类
class WithAttr(object): def __init__(self, name, age):
self.name = name
self.age1 = age if __name__ == '__main__':
without_attr = WithoutAttr()
with_attr = WithAttr("Alex", age=32)
# 使用__sizeof__方法,不管带不带属性,都是固定大小32
print(without_attr.__sizeof__()) # 打印32
print(with_attr.__sizeof__()) # 打印32
# 使用sys.getsizeof方法,不管带不带属性,都是固定大小56
print(sys.getsizeof(without_attr)) # 打印56
print(sys.getsizeof(with_attr)) # 打印56

我们可以看到,sys.getsizeof方法的值比__sizeof__的值大24。这24个bytes应该是gc管理所消耗的空间。

而且这两个方法的返回值大小都没有包含对象中的属性,也就是说在垃圾回收的时候,除了通过getsizeof方法获取对象本身大小,还要额外通过其他办法去获取其属性的大小,并进行回收。

观察list对象的占用空间:

list1 = [1, 2, 3, 4, 5, 6]
list2 = [1, 2, 3, 4, 5, 6, 7]
list3 = [1, 2, 3, 4, 5, 6, 7, 'string']
list4 = [1, 2, 3, 4, 5, 6, 7, Foo('Leo', age=32)]
print(list1.__sizeof__()) # 打印88
print(sys.getsizeof(list1)) # 打印112,比__sizeof__多24
print(sys.getsizeof(list2)) # 打印120,多一个int,多占8bytes
print(sys.getsizeof(list3)) # 打印128,多一个字符串,也多占8bytes
print(sys.getsizeof(list4)) # 打印128,多一个对象,也多占8bytes

同样的,getsizeof()比__sizeof__多24bytes。而列表中,每多一个元素(不管什么类型)都多占8bytes,我们可以猜想这8bytes是64bit机器中一个指针的大小。所以,getsizeof和__sizeof__都是只获取list第一层的内存占用。当然,这两个方法内部所包含的空间根据实现是不同的。

10.__class__、__dict__、__module__、__doc__属性

__class__:返回该生成该对象的类

print(f1.__class__)  # <class '__main__.Foo'>

__dict__:返回该对象的所有属性组成的字典

print(f1.__dict__)  # {'name': 'Alex'} 只有一个属性name

__module__:返回该对象所处模块

class Foo(object):
def __init__(self):
self.name = 'Alex' if __name__ == '__main__':
f1 = Foo()
print(f1.__module__) # 打印__main__

如果该对象对应的类在当前运行的模块,则打印__main__。

import test3

f = test3.Foo()
print(f.__module__) # 打印test3

如果对象对应的类在其他模块,则打印模块名。

__doc__:类的注释说明

class Foo(object):
"""
这是一个类,名叫Foo
"""
def __init__(self):
self.name = 'Alex' if __name__ == '__main__':
f1 = Foo()
print(f1.__doc__) # 打印 这是一个类,名叫Foo

###

[Python之路] object类中的特殊方法的相关教程结束。

《[Python之路] object类中的特殊方法.doc》

下载本文的Word格式文档,以方便收藏与打印。