由 '' in 'abc' return True 引发的思考----Python 成员测试操作

最近遇到判断字典中是否存在空字符串‘’,这个很好判断,直接用:‘’ in [‘a‘,‘b‘,‘c‘],就可以直接判断出来;但是当我对字符串使用 “in” 方法进行判断的时候,发现:‘’ in ‘abc‘ 仍然会返回True,对于这个问题,之前一直没有注意到过其中的原理,现在去进行探索总结一下:

首先,查看官方文档:https://docs.python.org/2/reference/expressions.html#not-in

文档在5.9.2中:Membership test operations中是如下说明的:

大概翻译一下意思就是说:  

  “in” 和 “not in” 是对集合成员的检测操作,如果 x 在 集合s 中的话那么 x in s 返回True,否则返回False。x not in s 跟 x in s 判断是相反的。 成员的检测被绑定到序列;如果集合是序列,并且包含与该对象相等的元素,则对象是集合的成员。然而,对于许多其他对象类型来说,即使不是序列,但是支持成员测试也是有意义的。特别是,dict(key) 和 sets 支持成员资格测试。

  “列表” 和 “元祖” 类型:当且仅当,‘y‘ 中 存在一个下标 ’i‘ 使得 x is y[i] 或者 x == y[i] 成立,x in y 才会返回 True

  “Unicode” 和 “String” 类型: 要使 ‘x in y‘ return True 成立,当且仅当,’x‘ 是 ’y‘ 的一个子字符串。有个等效的测试为 y.find(x) != -1。注:’x‘ 和 ’y‘ 不需要相同的类型;比如:u‘ab‘ in ‘abc‘ 也会返回True。空字符串是任何字符串的子字符串,所以,“” in ‘abc‘ 会返回True。

  在版本2.3的时候被改变了:之前的版本,’x‘ 被要求是长度为 1 的字符串。

  对于用户自定义的类,分为以下三种情况考虑:

    a.对于有__contains__()方法的用户自定义类:如果 y.__contains__(x) 为 True,则 x in y 返回True

    b.对于没有定义__contains__()方法,但是定义了__iter__()方法:如果 有值 ‘z‘ 在对 ’y‘ 进行迭代的时候 x==z 成立,那么 x in y 会返回True,如果在迭代过程中引发异常,则会抛出该 in 异常。

    c.对于定义了__getitem__()方法的类:当且仅当含有一个非负的整数下标 i 使得 x == y[i] 成立,那么 x in y 才会返回True,所有较低的整数索引不会引发IndexError异常。(如果有任何其他的异常出现,也会出现 in 操作出现异常)

  “not in” 操作和 “in” 操作产生的结果相反

看完官方文档后,对于判断“String”类型的时候,可以通过 y.find(x) != -1 来测试其是否成立,但是这个原理是怎么来的,还是想进一步进行探究,下面查看Python2.7的源码:

首先,猜测在源码中首先应该和对象类型有关系,然后找到发现有typeobject.c文件,浏览后发现,含有如下代码:

SQSLOT("__contains__", sq_contains, slot_sq_contains, wrap_objobjproc,
           "x.__contains__(y) <==> y in x"),

然后接下来推测去找跟__contains__方法有关的和 上面说到的 find() 方法有关的源码:

  在stringlib头文件文件夹中,发现有 find.h 文件,然后在其中发现了如下函数:

Py_LOCAL_INLINE(int)
stringlib_contains_obj(PyObject* str, PyObject* sub)
{
    return stringlib_find(
        STRINGLIB_STR(str), STRINGLIB_LEN(str),
        STRINGLIB_STR(sub), STRINGLIB_LEN(sub), 0
        ) != -1;
}

  然后进一步去找到 stringlib_find() 的定义:

Py_LOCAL_INLINE(Py_ssize_t)
stringlib_find(const STRINGLIB_CHAR* str, Py_ssize_t str_len,
               const STRINGLIB_CHAR* sub, Py_ssize_t sub_len,
               Py_ssize_t offset)
{
    Py_ssize_t pos;

    if (str_len < 0)
        return -1;
    if (sub_len == 0)
        return offset;

    pos = fastsearch(str, str_len, sub, sub_len, -1, FAST_SEARCH);

    if (pos >= 0)
        pos += offset;

    return pos;
}

  从这里可以看到 当str_len == 0的时候,返回 offset,而 offset 已经初始化为了 0,从这里也可以大概得出:y.find(x) != -1,当 ’x‘ 为 ’空字符串‘ 时返回 0;当 ’x‘ 存在 ‘y‘ 中的时候,返回 对应的偏移量。然后接下来就会判断返回True 还是False。

因为源码关联性的原因,接下来可以在 stringobject.c 文件中,结合 find.h 进行对于其返回值的原理查看,这里就不一一列出来了。

源码目录:

  Objects/Stringlib/find.h

  Objects/typeobject.c

  Objects/stringobject.c

由 '' in 'abc' return True 引发的思考----Python 成员测试操作

时间: 2024-08-19 14:38:35

由 '' in 'abc' return True 引发的思考----Python 成员测试操作的相关文章

一个截取字符串函数引发的思考

背景 前些天,遇到这样一个问题,问题的内容如下: 要求编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串.但是要保证汉字不被截半个,如"我ABC", 4,截取后的效果应该为"我AB",输入"我ABC汉DEF", 6,应该输出为"我ABC",而不是"我ABC+汉的半个". 问题 刚看到这个问题的时候,以为还是很简单的,但写出来之后,发现并不是想要的效果.回想一下当时的思路,就发现刚开

js中return,return true,return false的用法及区别

1.语法及返回方式 ①返回控制与函数结果         语法为:return 表达式;         语句结果函数的执行,返回调用函数,而且把表达式的值作为函数结果返回出去 ②返回控制无函数结果         语法为:return;         在大多数情况下,为事件处理函数如果让其返回false,可以防止默认的事件行为.例如,默认情况下,点击一个<a>标签元素,页面会跳转到该元素href属性指定的页. 而return false就相当于终止符,return true就相当于执行符.

黑马程序员---Objective-C基础学习---一道课后习题引发的思考

------Java培训.Android培训.iOS培训..Net培训.期待与您交流! ------- 一道课后习题引发的思考 /* 需求:设计一个类Point2D,用来表示二维平面中某个点 1> 属性 * double x * double y 2> 方法 * 属性相应的set和get方法 * 设计一个对象方法同时设置x和y * 设计一个对象方法计算跟其他点的距离 * 设计一个类方法计算两个点之间的距离 3> 提示 * C语言的math.h中有个函数:double pow(double

从一个聊天信息引发的思考之Android事件分发机制

     转载请声明:http://www.cnblogs.com/courtier/p/4295235.html 起源:        我在某一天看到了下面的一条信息(如下图),我想了下(当然不是这个人问的问题)“为什么Activity能够与界面交互和为什么它们        的事件能够传递起来?”我带着这些疑问,自己上网查阅了一些资料与信息,从而得出以下的原理. Activity Window View 的关系:         我的归纳:众所周知,Activity并非是真正的显示对象.Ac

由一个投票算法引发的思考

博主的APP最近又新加了一个小功能,每个员工都可以上传自己的工作照,其他员工可以点赞,规则是:每张工作照每个员工(除上传者外)每日可点赞一次.举个例子: 现有注册员工ABCD四人,A上传工作照两张P1和P2,BCD三人每天可为P1.P2分别点赞一次 博主略加思考,写了下面一段代码来实现: 1 /// <summary> 2 /// 投票 3 /// </summary> 4 /// <param name="id">被投票对象ID</param

JS return false 与 return true

在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性指定的页. Return False 就相当于终止符,Return True 就相当于执行符.在js中return false的作用一般是用来取消默认动作的.比如你单击一个链接除了触发你的onclick时间(如果你指定的话)以外还要触发一个默认事件就是执行页面的跳转.所以如果你想取消对象的默认动作就可以return false.return false应用比较

常见函数错误引发的思考.

今天在写代码的时候,我犯了一个很low的错误,废话不多说,直接上代码: 1 function () { 2 console.log('hello world'); 3 }() 大家看到之后,第一反应肯定会认为是个语法错误,可是自己仔细想想,这是什么原因?似乎还不能解释清楚,好奇宝宝模式立即启动,经过查阅相关资料得到了答案,接下来我们一起来探讨下其中的原理. 疑惑解答 大家有没有考虑过为什么上面这种写法会报错? 原来,浏览器遇到function关键字的时候会认为这是一个函数声明,函数声明必须包括:

class_copyIvarList方法获取实例变量问题引发的思考

在runtime.h中,你可以通过其中的class_copyIvarList方法来获取实例变量.具体的实现如下(记得导入头文件<objc/runtime.h>): - (NSArray *)ivarArray:(Class)cls { unsigned int stuIvarCount = 0; Ivar *ivars = class_copyIvarList(cls, &stuIvarCount); if (stuIvarCount == 0) { return nil; } NSM

由DBCursor的“can&#39;t switch cursor access methods”异常引发的思考

先谈谈我是怎么用的: DBCollection dbcollection = XXXXXXXXXX(); //连接mongo DBCursor dbCursor = mergeVideoDB.find(XXXX); //根据name查出若干个 if (dbCursor.length() == 1) { return videoinfos; } while(dbcursor.hasNext()){ // 这一步产生错误,报出DBCursor的"can't switch cursor access