翻译《Writing Idiomatic Python》(三):变量、字符串、列表

原书参考:http://www.jeffknupp.com/blog/2012/10/04/writing-idiomatic-python/

上一篇:翻译《Writing Idiomatic Python》(二):函数、异常

下一篇:TO BE UPDATED..

2.1 变量

2.1.1 对多个变量要赋同一个值时,使用链式赋值让语句变得简明

Python支持链式赋值使多个变量可以在一次链式赋值中被设置为同一个值,这使得语句更加简明。

不良风格:

1 x = ‘foo‘
2 y = ‘foo‘
3 z = ‘foo‘

地道Python:

1 x = y = z = ‘foo‘

2.1.2 避免使用临时变量来实现值交换

在Python中完全没有必要使用一个额外的临时变量来实现值交换。使用元组来实现不仅方便并且可读性更强。

不良风格:

1 foo = ‘Foo‘
2 bar = ‘Bar‘
3 temp = foo
4 foo = bar
5 bar = temp

地道Python:

1 foo = ‘Foo‘
2 bar = ‘Bar‘
3 (foo, bar) = (bar, foo)

2.2 字符串

2.2.1 对字符串相关的函数使用链式调用使意图更简明

当对某个字符串数据进行一系列的处理时,直接在上一个调用后接下一个调用常常比起创建一系列临时变量的方法更加明确和简单。当然,如果链式调用太多也会破坏可读性,一般来说如果操作不超过三个使用链式调用会更好。

不良风格:

1 book_info = ‘ The Three Musketeers: Alexandre Dumas‘
2 formatted_book_info = book_info.strip()
3 formatted_book_info = formatted_book_infor.upper()
4 formatted_book_info = formatted_book_infor.replace(‘:‘, ‘by‘)

地道Python:

1 book_info = ‘ The Three Musketeers: Alexandre Dumas‘
2 formatted_book_info = book_info.strip().upper().replace(‘:‘, ‘by‘)

2.2.2 使用‘‘.join连接列表中的字符串元素

这样做更快,占用更低内存,并且这个用法在Python中非常普遍。注意下面的例子中使用的是用‘‘连接字符串,实际在使用的时候可以替换为你想要的分隔符。

不良风格:

1 result_list = [‘True‘, ‘False‘, ‘File not found‘]
2 result_string = ‘‘
3 for result in result_list:
4     result_string += result

地道Python:

1 result_list = [‘True‘, ‘False‘, ‘File not found‘]
2 result_string = ‘‘.join(result_list)

2.2.3 使用ord获取字符的ASCII码,使用chr从ASCII码获取字符

获取一个字符的ASCII码是一个有用的功能(比如字符串散列化),相应的,从ASCII得到对应的字符也常常很有用。

Python中提供了两个内建的函数,chrord,可以实现字符和ASCII码之间的相互转化。

不良风格:

 1 hash_value = 0
 2 character_hash = {
 3     ‘a‘: 97,
 4     ‘b‘: 98,
 5     ‘c‘: 99,
 6     # ...
 7     ‘y‘: 121,
 8     ‘z‘: 122,
 9 }
10 for e in some_string:
11     hash_value += character_hash[e]
12 return hash_value

地道Python:

1 hash_value = 0
2 for e in some_string:
3     hash_value += ord(e)
4 return hash_value

2.2.4 用format函数来进行字符串格式化

一般来说又三种方式来进行字符串格式化:最简单但是最不推荐的就是用+来连接字符串。另一种方式是老式的利用%来格式化字符串的办法,在其他许多语言中也能看到这种方式,比如一些语言中的printf。这种方法比用+的方法好一些。

在Python中,最地道和清晰的用法当属用format函数来进行字符串格式化。和老式的格式化方法类似,这种办法用带有格式的字符串作为模板并用一些值替换占位符生成最终字符串。比老式的格式化方法更好的地方是,在format函数中,我们可以命名占位符,获取占位符的对应变量的属性,控制字符宽度和填充等。format函数让字符串格式化显得简明。

不良风格:

1 def get_formatted_user_info_worst(user):
2     # Tedious to type and prone to conversion errors
3     return ‘Name: ‘ + user.name + ‘, Age: ‘ + str(user.age) + ‘, Sex: ‘ + user.sex
4
5 def get_formatted_user_info_slightly_better(user):
6     # No visible connection between the format string placeholders
7     # and values to use. Also, why do I have to know the type?
8     # Don‘t these types all have __str__ functions?
9     return ‘Name: %s, Age: %i, Sex: %c‘ % (user.name, user.age, user.sex)

地道Python:

1 def get_formatted_user_info(user):
2     # Clear and concise. At a glance I can tell exactly what
3     # the output should be. Note: this string could be returned
4     # directly, but the string itself is too long to fit on the
5     # page.
6     output = ‘Name: {user.name}, Age: {user.age}, Sex: {user.sex}‘.format(user=user)
7     return output

2.3 列表

2.3.1 使用列表解析从一个列表生成新的列表

在恰当使用的情况下,列表解析会增加代码从一个列表中创建新列表的明确性。尤其是当新创建的列表是源列表的某种变换或者条件检查时。

除了使代码更清晰,列表解析在执行效率上也非常高(CPython中)。

不良风格:

1 some_other_list = range(10)
2 some_list = list()
3 for element in some_other_list:
4     if is_prime(element):
5         some_list.append(element + 5)

地道Python:

1 some_other_list = range(10)
2 some_list = [element + 5 for element in some_other_list if is_prime(element)]

2.3.2 使用负数下标

一个常被很多Python初用者忽视的特性是,在Python的列表和字符串中是可以使用负数下标的。和正数下标从列表开头向后数不同,附属下标从列表的末尾往回数。

不良风格:

1 def get_suffix(word):
2     word_length = len(word)
3     return word[word_length - 2:]

地道Python:

1 def get_suffix(word):
2     return word[-2:]

2.3.3 和内建的map()以及filter()函数相比,优先使用列表解析

Python是一门自诞生以来就一直在演化的语言。也正因为如此,一直有一些历史遗留被保留了下来。mapfilter函数就是例子,尽管曾经在一些情况下用mapfilter是最佳的选择,但是现在几乎所有的使用都可以用列表解析来代替。并且列表解析的可读性和清晰性更好,所以至少在我的书里我认为应该优先使用列表解析而不是mapfilter的组合。

不良风格:

1 the_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
2 def is_odd(number):
3     return number % 2 == 1
4 odd_numbers = filter(is_odd, the_list)
5 odd_numbers_times_two = list(map(lambda x: x * 2, odd_numbers))

地道Python:

1 the_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
2 odd_numbers_times_two = [n * 2 for n in the_list if n % 2 == 1]

// 其实这是个很见仁见智的问题,在stackoverflow上也有很多关于map/filter和list comprehension的争论,就效率而言,对不同的情况下两种办法互有胜负,就可读性而言其实我觉得map和filter比list comprehension好很多。。另外别忘了还有个函数叫reduce

2.3.4 使用内建的sum函数对列表中的元素求和

对于一些已经用习惯sum的人来说可能会觉得这条比较奇怪。然而对更多的Python新手而言他们做的是自己重新实现了sum函数。如果一个函数已经是内建的,那么我们不应该重新发明轮子。

不良风格:

1 the_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
2 the_sum = 0
3 for element in the_list:
4     the_sum += element

地道Python:

1 the_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
2 the_sum = sum(the_list)

2.3.5 使用all检查一个可遍历结构中是否所有元素都是真

sum一样,all也是一个被新手频繁重写的内建函数。它可以检查一个可遍历结构中的元素是否都为真。

不良风格:

1 def contains_zero(iterable):
2     for e in iterable:
3         if e == 0:
4             return True
5     return False

地道Python:

1 def contains_zero(iterable):
2     # 0 is "Falsy," so this works
3     return not all(iterable)

2.3.6 优先使用xrange而不是range,除非你需要的就是range生成的列表

xrangerange都能让你遍历一个数值列表。区别是,xrange不会再内存中存储一个完整的列表。大多数情况下这两者不会再实际使用时产生区别,但是当你需要遍历的数值范围非常大时,在内存占用和执行效率上就能看到很大差别了。

不良风格:

1 # A loop over a large range that breaks out
2 # early: a double whammy!
3 even_number = int()
4 for index in range (1000000):
5     if index % 2 == 0:
6         even_number = index
7         break

地道Python:

1 even_number = int()
2 for index in xrange(1000000):
3     if index % 2 == 0:
4         even_number = index
5         break

转载请注明出处:達聞西@博客园

上一篇:翻译《Writing Idiomatic Python》(二):函数、异常

下一篇:TO BE UPDATED..

时间: 2024-11-09 00:02:06

翻译《Writing Idiomatic Python》(三):变量、字符串、列表的相关文章

翻译《Writing Idiomatic Python》(五):类、上下文管理器、生成器

原书参考:http://www.jeffknupp.com/blog/2012/10/04/writing-idiomatic-python/ 上一篇:翻译<Writing Idiomatic Python>(四):字典.集合.元组 下一篇:TO BE UPDATED.. 2.7 类 2.7.1 用isinstance函数检查一个对象的类型 许多新手在接触Python之后会产生一种“Python中没有类型”的错觉.当然Python的对象是有类型的,并且还会发生类型错误.比如,对一个int型对象

翻译《Writing Idiomatic Python》(一):if语句、for循环

开篇废话 这是在美国Amazon上评价很不错的一本书,其实严格来说这可能不算书,而是一本小册子.就像书名一样,里面的内容主要是用一些例子讲述地道的Python的代码是怎样写的.书中把很多例子用不良风格和地道Python写法作对比,内容覆盖谈不上很全,但是每一条都很有代表性.总体而言非常适合新手,同时里面有些条目老手看了或许也会有豁然开朗的感觉.作者Jeff Knupp曾在全球最牛B的高盛和其他银行里做过金融系统开发,在北美Python社区里也很有活跃度. 自己用Python也有些年头了,做过一年

我要翻译《Think Python》-002 贡献列表 &amp; 目录部分

PDF源文件地址 :  http://www.greenteapress.com/thinkpython/thinkpython.pdf 贡献列表 自从本书诞生之后,有超过上百个目光敏锐且有想法的读者给我发来了许多建议并指出了一些需要修正的地方.他们的热情和无私的奉献给了我巨大的帮助.如果你有任何建议或者发现需要修正的地方,请发邮件至:[email protected].如果您的建议被采纳,您的大名将会出现在我们的贡献人员列表(除非你本人过于低调拒绝承认).如果您发现文中的错误内容,敬请提供一下

Python(三) 变量与运算符

一.什么是变量 变量 = [1,2] 二.变量的命名规则 字母,数字,下划线,首字母不能是数字 系统关键字 不能用在变量名中 保留关键字 区别大小写 a=1,   a='1',   a=(1,2),   a={1,2} 三.值类型与引用类型 int  str  tuple(不可改变)   值类型 list  set   dict(可变)   引用类型 id()  显示变量的内存地址 四.列表的可变与元组的不可变 a=(1,2,3,[4,5,8])   a[3][2]=8 a[3][2]='8' 

python中的字符串 列表 字典

字符串     一个有序的字符集合  不可变 1,可以使用for in语句进行迭代循环,返回元素    2,in类是于str.find()方法但是是返回布尔结果        str.find()返回的是位置操作    查找字符串:        find 找不到返回-1        rfind    从右边        index    报错      都是从左边开始查找        rindex   从右边    统计字符串个数        count    替换字符串       

《python解释器源码剖析》第3章--python中的字符串对象

3.0 序 我们知道python中的字符串属于变长对象,当然和int也是一样,底层的结构体实例所维护的数据的长度,在对象没有定义的时候是不知道的.当然如果是python2的话,底层PyIntObject维护的就是一个long,显然在没创建的时候就知道是1. 可变对象维护的数据的长度只能在对象创建的时候才能确定,举个例子,我们只能在创建一个字符串或者列表时,才知道它们所维护的数据的长度,在此之前,我们对此是一无所知的. 注意我们在前面提到过可变对象和不可变对象的区别,在变长对象中,实际上也可以分为

Python数值和字符串

Python数据类型 数值 字符串 列表 元组 字典 1.1    数值的类型 整形 长整型 浮点数 复数类 字符串类型,有3种方法可以定义: 在python中 单引号 和双引号没有任何区别,在shell中单引号是完全引用,双引号表示部分引用. str = 'this is a string' str = "this is a string" str = '''this is a string''' a = "hello\nworld" 三重引号既可以表示注释,也可

Python中高级变量类型(列表,元组,字典,字符串,公共方法...)

高级变量类型 目标 列表 元组 字典 字符串 公共方法 变量高级 知识点回顾 Python 中数据类型可以分为 数字型 和 非数字型 数字型 整型 (int) 浮点型(float) 布尔型(bool) 真 True 非 0 数 —— 非零即真 假 False 0 复数型 (complex) 主要用于科学计算,例如:平面场问题.波动问题.电感电容等问题 非数字型 字符串 列表 元组 字典 在 Python 中,所有 非数字型变量 都支持以下特点: 都是一个 序列 sequence,也可以理解为 容

[Python学习笔记1]Python语言基础 数学运算符 字符串 列表

这个系列是我在学习Python语言的过程中记录的笔记,主要是一些知识点汇总,而非学习教程,可供有一定编程基础者参考.文中偏见和不足难以避免,仅供参考,欢迎批评指正. 本系列笔记主要参考文献是官网文档:http://docs.python.org/.在此向文档编辑者致谢.请勿将本文用于商业用途. 一.Python语言介绍 首先,Python是一种广泛应用的通用高级编程语言,具有较高的抽象层次,支持面向对象的编程方法.其具有高级的数据结构和许多方便的库文件,可以完成文件IO.系统调用.网络编程,甚至