在python2.x的版本中,支持不同类型的比较,其比较原则如下:
内置类型:
1.同一类型: 1.1)数字类型:包含int、float、long、complex、bool(bool类型是int的子类,且True=1, False=0)。就按照数字的大小进行比较,例如:
1.2)非数字类型:1.2.1)如果类型中定义了如__cmp__、__gt__等魔法方法,就按照其魔法方法的返回值进行比较,具体如何就是这篇文章接下来要讨论的内容。
1.2.2)如果没有定义上述的魔法方法,就按照 id 函数的返回值进行比较,由于 id 函数返回的是 int,所以返回值按照数字的规则进行比较。
2.不同类型:2.1)如果比较的对象中含有数字类型,例如:int 和 str 进行比较。数字类型将小于其他任何类型,也就是说“数字类型是最小的”(不包括None,None比数字类型还小,所以应该说是None最小,但很少会使用None类型比较,所以这里忽略None,得出数字类型最小的结论)。
2.2)如果比较的对象中不含有数字类型,例如 dict 和 str 进行比较。那么就按类名进行比较,所以 {} < ‘‘ 相当于 ‘dict‘ < ‘str‘ ,即将类名转换为字符串,然后按字符串的原则进行比较。
这里有几点要补充的:
虽然内置类型基本都实现了__eq__、__ge__、__gt__等内置方法,但是这里有必要对相同类型实例直接的比较进行总结说明:
1.序列的比较:
序列的比较是按照索引顺序取出元素进行比较,如果不两个系列不等长,则可以看作是在短的序列后面填充 None ,直到两个序列等长。
在 tuple 和 list 的讨论中,我使用了打擂台的比喻。两个比较的序列相当于按照索引顺序派出选手,比赛采用的是残酷的赛制,一旦某个选手失败,那么那个队伍就会输掉。也就是说一旦某个元素小于对面,那么整个序列都会小于另一个序列。
当然这里说的是同一类型的序列,例如 str、list、tuple之间的比较是属于不同内置类型的比较,按照上面的原则,就是按照类名进行比较。所以这里讨论的是 str和 str 的比较;list 和 list 的比较;tuple 和 tuple的比较。
str 和 str 之间的比较:首先按照序列顺序排出元素,而 str 中的元素就是单个字符,然后字符之间的比较是通过将其转换为 acsll 码后进行数字之间的比较的。python 中提供了一个内置的函数 ord 来进行这项工作:
还有一个反函数 chr 用来将数字转换成字符:
所以,当字符串 ‘abc‘ 和字符串 ‘abe‘ 进行比较时,前两个字符相等,而 ‘e‘ > ‘c‘ ,所以 ‘abe‘ > ‘abc‘。
如果两者不等长时,例如:‘abc‘ 和 ‘ab‘ 进行比较,前两字符相等,而 ‘c‘ 相对于和 None 比,None又最小,所以 ‘abc‘ > ‘ab‘ 。
其他序列也遵循这个逐项比较的原则,例如:[1, 2, 3] 和 [1, [2], 3] 比较时,第一个元素相等,所以比第二个元素。第二元素是不同类型的,其中一个是数字,数字除None外最小,所以第二个列表比较大。如果一直比较下去都相等的话,那么就判断两个元素相等(== )。但是这并不意味着两个元素是同一个对象,所以 is 判断不一定为 True。
另外,中文是按照编码的字符串进行比较的,例如:
‘d‘ > ‘b‘ 所以 ‘一‘ > ‘二‘。但字符串的编码是会根据编码声明而改变的,例如 # coding: utf-8 和 # coding= gbk 的字符串编码就不一样,所以比较会有差异性。但是也很少会进行中文之间的比较。
集合和序列的比较方法类似。
2.字典间的比较:
字典其实也类似于序列,也是逐个比较,但字典比较的是键不是值,而且字典是无序的,所以比较的顺序难以预测,所以无论如何,不建议字典间的比较。
版本差异:
由于不同内置类型之间的比较不符合人的直觉,而且行为怪异,难以估计。所以python3.x中取消了不同内置类型之间比较的支持,例如:在python3.x中进行 int 和 str 之间的比较时会直接抛出异常。
自定义的类:
1.继承自基本类型且没有重写相关的魔法方法,那么就按照上面内置类型的原则进行比较。
2.自定义的类,但没有重写相关魔法方法。那么 新式类 > 经典类;新式类之间按类名进行比较;经典类之间按 id 函数的返回值进行比较。
3.只要重写了相应的魔法方法,那么就按照魔法方法的返回值作为结果。不管是否继承自基本类型。
相关魔法方法:
__cmp__(self, other) :对应于python的内置函数 cmp ,在self > other 时应该返回 正整数;self == other时,返回 0;当self < other时应该返回一个 负整数。(这个方法因为和下面的方法存在冗余,所以在python3.x中被删除了。)
例子:
class Foo(str): def __new__(cls, word): return str.__new__(cls, word) def __cmp__(self, other): if (‘scolia‘ in self) and (‘scolia‘ in other): return 0 elif ‘scolia‘ in self: return 1 else: return -1 a = Foo(‘scolia‘) b = Foo(‘scolia123‘) c = Foo(‘good‘) d = Foo(‘Good‘) print cmp(a, b) print cmp(b, c) print cmp(c, d)
在这个例子中,我定义凡是两个字符串中都有子串‘scolia‘的,都返回0;当个只有一个有,且有的那个作为第一个参数时,返回1;两个都没有,不管是什么都返回-1。
也就是说cmp函数的第一个参数就是 self ,第二个参数就是 other。
当然 cmp 还有一个隐藏特性, 当两个参数为同一对象的时候,直接返回0而不管内部的__cmp__逻辑如果,例如:
c = Foo(‘good‘) d = c print cmp(c, d)
本来按照自己写的代码的逻辑的话,c 和 d 都不含字串 ‘scolia‘ ,应该返回-1才对,但是实际上得到的却是0。说明cmp函数对于同一对象是直接给出结果而不理魔法方法的。
- __eq__(self, other)
- 定义相等符号的行为,==
- __ne__(self,other)
- 定义不等符号的行为,!=
- __lt__(self,other)
- 定义小于符号的行为,<
- __gt__(self,other)
- 定义大于符号的行为,>
- __le__(self,other)
- 定义小于等于符号的行为,<=
- __ge__(self,other)
- 定义大于等于符号的行为,>=
以上魔法方法都必须返回一个布尔值。
例如:
class Foo(str): def __new__(cls, word): return str.__new__(cls, word) def __eq__(self, other): if (‘scolia‘ in self ) and (‘scolia‘ in other): return True else: return False a = Foo(‘scolia‘) b = Foo(‘scolia123‘) print a == b
所以,这些魔法方法其实就是重载了相应的符号而已,例如这里的 == ,左边的相当于 self,右边的相当于 other。你可以根据自己的需要进行逻辑编排。
又例如:
class Foo(str): def __new__(cls, word): return str.__new__(cls, word) def __gt__(self, other): return len(self) > len(other) def __lt__(self, other): return len(self) < len(other) def __ge__(self, other): return len(self) >= len(other) def __le__(self, other): return len(self) <= len(other)
这里重载了多个比较符,是核心是按照字符串的长度进行比较,越长的越大。这里看似返回的是一个表达式,但是函数在真正返回的时候会将这个表达式计算出来,也就是说最终返回的其实还是布尔值。
而没有重载的比较符,如这里没有重载 __eq__ 即 == ,将自动调用其父类的方法,这也很符合我们继承的概念。
如果和基本类型比较呢:
class Foo(str): def __new__(cls, word): return str.__new__(cls, word) def __eq__(self, other): if (‘scolia‘ in self ) and (‘scolia‘ in other): return True else: return False b = Foo(‘scolia‘) a = ‘scolia123‘ print a == b print b == a
貌似是以我们自己写的方法为准,不管 == 两边的顺序如何。
如果两个自定义的类冲突呢:
class Foo(str): def __new__(cls, word): return str.__new__(cls, word) def __eq__(self, other): if (‘scolia‘ in self ) and (‘scolia‘ in other): return True else: return False class Boo(str): def __new__(cls, word): return str.__new__(cls, word) def __eq__(self, other): if (‘scolia‘ in self ) and (‘scolia‘ in other): return False else: return True a = Foo(‘scolia‘) b = Boo(‘scolia‘) print a == b print b == a
此时,谁在 == 号的左边,就运用谁的规则。
关于比较的魔法方法就讨论到这里,欢迎大家交流。
相关的参考资料:戳这里