python 类和元类(metaclass)的理解和简单运用
针对https://segmentfault.com/a/1190000006814152这篇文章的理解以及在python3中的改造。
1.python中的类
首先在python中,所有东西都是对象。这句话非常重要,要理解元类要重新来理解一下python中的类。
class Trick(object):
pass
当python在执行带class语句的时候,会初始化一个类对象放在内存里面。例如这里会初始化一个Trick对象。这个对象(类)自身拥有创建对象(通常我们说的实例,但是在python中还是对象)的能力。
为了方便后续理解,我们可以先尝试一下在新式类中最古老厉害的关键字type。
input:
class Trick(object):
pass
print(type('123'))
print(type(123))
print(type(Trick()))
output:
<type 'str'>
<type 'int'>
<class '__main__.Trick'>
可以看到能得到我们平时使用的 str, int, 以及我们初始化的一个实例对象Trick()。
但是下面的方法你可能没有见过,type同样可以用来动态创建一个类。
type(类名, 父类的元组(针对继承的情况,可以为空),包含属性的字典(名称和值))。
这个怎么用呢,我要用这个方法创建一个类,让我们看下下面的代码:
input:
print(type('trick', (), {}))
output:
<class '__main__.trick'>
同样我们可以实例化这个类对象
input:
print(type('trick', (), {})())
output:
<__main__.trick object at 0x01033A30>
可以看到,这里就是一个trick的实例对象了。
同样的这个方法还可以初始化创建类的父类,同时也可以初始化类属性:
input:
class FlyToSky(object):
pass
pw = type('Trick', (FlyToSky, ), {'laugh_at': 'hahahaha'})
print(pw().laugh_at)
print(pw.__dict__)
print(pw.__bases__)
print(pw().__class__)
print(pw().__class__.__class__)
output:
hahahaha
{'__module__': '__main__', 'laugh_at': 'hahahaha', '__doc__': None}
(<class '__main__.FlyToSky'>,)
<class '__main__.Trick'>
<type 'type'>
下面我将依次理一下上面的内容,在此之前我必须先介绍两个魔法方法:
1.__class__这个方法用于查看对象属于是哪个生成的,这样理解在python中的所有东西都是对象,类对象也是对象。如果按照以前的思维来想的话就是类是元类的实例,而实例对象是类的实例。
2.__bases__这个方法用于得到一个对象的父类是谁,特别注意一下__base__返回单个父类,__bases__以tuple形式返回所有父类。
好了知道了这两个方法我来依次说一下每行什么意思。
1.使用type创建一个类赋值给pw type的接受的三个参数的意思分辨是(类的名称, 类是否有父类(), 类的属性字典{})
2.这里初始化一个类的实例,然后尝试去获得父类的laugh_at属性值,然后得到结果hahahaha
3.取一个pw的也就是我们常见类的类字典数据
4.拿到pw的父类,结果是我们指定的 FlyToSky
5.pw的实例pw()属于哪个类初始化的,可以看到是class Trick
6.我们再看class trick是谁初始化的? 就是元类type了
2.什么是元类以及简单运用
到底什么是元类?通俗的就是说,元类就是创建类的类。。。这样听起来是不是超级抽象?来看看这个:
Trick = MetaClass()
MyObject = Trick()
上面我们已经介绍了,搞一个Trick可以直接这样:
Trick = type('Trick', (), {})
可以这样其实就是因为,Type实际上是一个元类,用他可以去创建类。什么是元类刚才说了,元类就是创建类的类。也可以说他就是一个类的创建工厂。
类上面的__metaclass__属性,相信愿意了解元类细节的盆友,都肯定见过这个东西,而且为之好奇。不然我不知道是什么支撑你看到这里的?使用了__metaclass__这个魔法方法就意味着就会用__metaclass__指定的元类来创建类了。
class Trick(FlyToSky):
pass
当我们在创建上面的类的时候,python做了如下的操作:Trick中有__metaclass__这个属性吗?如果有,那么Python会在内存中通过__metaclass__创建一个名字为Trick的类对象,也就是Trick这个东西。如果Python没有找到__metaclass__,它会继续在自己的父类FlyToSky中寻找__metaclass__属性,并且尝试以__metaclass__指定的方法创建一个Trick类对象。如果Python在任何一个父类中都找不到__metaclass__,它也不会就此放弃,而是去模块中搜寻是否有__metaclass__的指定。如果还是找不到,好吧那就是使用默认的type来创建Trick。
那么问题来了,我们要在__metaclass__中放置什么呢?答案是可以创建一个类的东西,type,或者任何用到type或子类化type的东西都行。
3.自定义元类
自定义类的的目的,我总结了一下就是拦截类的创建,然后修改一些特性,然后返回该类。是不是有点熟悉?没错,就是感觉是装饰器干的事情,只是装饰器是修饰一个函数,同样是一个东西进去,然后被额外加了一些东西,最后被返回。
其实除了上面谈到的制定一个__metaclass__,并不一定要是正式类,是一个函数也可以。要创建一个使所有模块级别都是用这个元类创建类的话,在模块级别设定__metaclass__就可以了。先写一个来试试看,我还是延用stackoverflow上面那个哥们的例子,将所有的属性都改为大写的。
来看这个例子:
input:
def upper_attr(class_name, class_parents, class_attr):
"""
返回一个对象,将属性都改为大写的形式
:param class_name: 类的名称
:param class_parents: 类的父类tuple
:param class_attr: 类的参数
:return: 返回类
"""
# 生成了一个generator
attrs = ((name, value) for name, value in class_attr.items() if not name.startswith('__'))
uppercase_attrs = dict((name.upper(), value) for name, value in attrs)
return type(class_name, class_parents, uppercase_attrs)
__metaclass__ = upper_attr
pw = upper_attr('Trick', (), {'bar': 0})
print(hasattr(pw, 'bar'))
print(hasattr(pw, 'BAR'))
print(pw.BAR)
output:
False
True
0
可以从上面看到,我实现了一个元类(metaclass), 然后指定了模块使用这个元类来创建类,所以当我下面使用type进行类创建的时候,可以发现小写的bar参数被替换成了大写的BAR参数,并且在最后我调用了这个类属性并打印了它。
上面我们使用了函数做元类传递给类,下面我们使用一个正式类来作为元类传递给__metaclass__:
class UpperAttrMetaclass(type):
def __new__(cls, class_name, class_parents, class_attr):
attrs = ((name, value) for name, value in class_attr.items() if not name.startswith('__'))
uppercase_attrs = dict((name.upper(), value) for name, value in attrs)
return type.__new__(cls, class_name, class_parents, uppercase_attrs)
class Trick(metaclass=UpperAttrMetaclass):
bar = 12
money = 'unlimited'
print(Trick.BAR)
print(Trick.MONEY)
4.元类的使用场景
ORM全称“Object Relational Mapping”,即对象-关系映射,就是把关系数据库的一行映射为一个对象,也就是一个类对应一个表,这样,写代码更简单,不用直接操作SQL语句。
要编写一个ORM框架,所有的类都只能动态定义,因为只有使用者才能根据表的结构定义出对应的类来。
让我们来尝试编写一个ORM框架。
编写底层模块的第一步,就是先把调用接口写出来。比如,使用者如果使用这个ORM框架,想定义一个User类来操作对应的数据库表User,我们期待他写出这样的代码:
class User(Model):
# 定义类的属性到列的映射:
id = IntegerField('id')
name = StringField('username')
email = StringField('email')
password = StringField('password')
# 创建一个实例:
u = User(id=12345, name='Michael', email='test@orm.org', password='my-pwd')
# 保存到数据库:
u.save()
其中,父类Model和属性类型StringField、IntegerField是由ORM框架提供的,剩下的魔术方法比如save()全部由metaclass自动完成。虽然metaclass的编写会比较复杂,但ORM的使用者用起来却异常简单。
现在,我们就按上面的接口来实现该ORM。
首先来定义Field类,它负责保存数据库表的字段名和字段类型:
class Field(object):
def __init__(self, name, column_type):
self.name = name
self.column_type = column_type
def __str__(self):
return '<%s:%s>' % (self.__class__.__name__, self.name)
在Field的基础上,进一步定义各种类型的Field,比如StringField,IntegerField等等:
class StringField(Field):
def __init__(self, name):
super(StringField, self).__init__(name, 'varchar(100)')
class IntegerField(Field):
def __init__(self, name):
super(IntegerField, self).__init__(name, 'bigint')
下一步,就是编写最复杂的ModelMetaclass了:
class ModelMetaclass(type):
def __new__(cls, name, bases, attrs):
if name=='Model':
return type.__new__(cls, name, bases, attrs)
print('Found model: %s' % name)
mappings = dict()
for k, v in attrs.items():
if isinstance(v, Field):
print('Found mapping: %s ==> %s' % (k, v))
mappings[k] = v
for k in mappings.keys():
attrs.pop(k)
attrs['__mappings__'] = mappings # 保存属性和列的映射关系
attrs['__table__'] = name # 假设表名和类名一致
return type.__new__(cls, name, bases, attrs)
以及基类Model:
class Model(dict, metaclass=ModelMetaclass):
def __init__(self, **kw):
super(Model, self).__init__(**kw)
def __getattr__(self, key):
try:
return self[key]
except KeyError:
raise AttributeError(r"'Model' object has no attribute '%s'" % key)
def __setattr__(self, key, value):
self[key] = value
def save(self):
fields = []
params = []
args = []
for k, v in self.__mappings__.items():
fields.append(v.name)
params.append('?')
args.append(getattr(self, k, None))
sql = 'insert into %s (%s) values (%s)' % (self.__table__, ','.join(fields), ','.join(params))
print('SQL: %s' % sql)
print('ARGS: %s' % str(args))
当用户定义一个class User(Model)时,Python解释器首先在当前类User的定义中查找metaclass,如果没有找到,就继续在父类Model中查找metaclass,找到了,就使用Model中定义的metaclass的ModelMetaclass来创建User类,也就是说,metaclass可以隐式地继承到子类,但子类自己却感觉不到。
在ModelMetaclass中,一共做了几件事情:
1.排除掉对Model类的修改;
2.在当前类(比如User)中查找定义的类的所有属性,如果找到一个Field属性,就把它保存到一个__mappings__的dict中,同时从类属性中删除该Field属性,否则,容易造成运行时错误(实例的属性会遮盖类的同名属性);
3.把表名保存到__table__中,这里简化为表名默认为类名。
在Model类中,就可以定义各种操作数据库的方法,比如save(),delete(),find(),update()等等。
我们实现了save()方法,把一个实例保存到数据库中。因为有表名,属性到字段的映射和属性值的集合,就可以构造出INSERT语句。
编写代码试试:
u = User(id=12345, name='Michael', email='test@orm.org', password='my-pwd')
u.save()
输出如下:
Found model: User
Found mapping: email ==> <StringField:email>
Found mapping: password ==> <StringField:password>
Found mapping: id ==> <IntegerField:uid>
Found mapping: name ==> <StringField:username>
SQL: insert into User (password,email,username,id) values (?,?,?,?)
ARGS: ['my-pwd', 'test@orm.org', 'Michael', 12345]
可以看到,save()方法已经打印出了可执行的SQL语句,以及参数列表,只需要真正连接到数据库,执行该SQL语句,就可以完成真正的功能。
不到100行代码,我们就通过metaclass实现了一个精简的ORM框架。
5.小结
metaclass是Python中非常具有魔术性的对象,它可以改变类创建时的行为。这种强大的功能使用起来务必小心。