前言
本文主要来自《Python基础教程(第2版)》([挪]Magnus Lie Hetland著,司维 曾军崴 谭颖华译 人民邮电出版社) 中的“附录A 简明版本”,对于其中的有问题之处进行修改,仅是个人理解,若有错误敬请见谅。
简介
本部分是基于我([挪]Magnus
Lie Hetland)的流行网络教程“instant
Python”(http://hetland.org/writing/instant-python.html)的一个简短的Python介绍。它面向那些已经掌握一到两门语言,希望能够快速掌握Python的程序员。有关下载和执行Python解释器的信息,请参见第1章。
A.1 基础知识
如果想对Python 语言有一个基本了解,那么可以把它想象成伪代码——其实这已经非常接近事实了。变量没有类型,所以不需要进行声明。变量在赋值时出现,不再使用的时候则会消失。赋值使用=运算符完成,像下面这样:
x = 42
注意:相等性的检测是由==运算符完成的。
还可以一次对多个变量进行赋值:
x, y, z = 1, 2, 3 first, second = second, first a = b =123
语句块 通过并且只通过 缩进 表示(没有begin/end语句或者括号)。下面是一些普通的控制结构:
前两个例子是等价的。
if x < 5 or (x > 10 and x < 20): print "The value is OK." if x < 5 or 10 < x < 20: print "The value is OK." for i in [1, 2, 3, 4, 5]: print "This is iteration number ", i x = 10 while x >= 0: print "x is still not negative." x = x-1
for 循环中的索引变量会迭代列表(本例中使用方括号写成)中的元素或者其他可迭代对象。为了实现“普通的”for循环(也就是计数循环),可以使用内建的range函数:
# 打印0-99的值,包括0和99 for value in range(100): print value
以井号开头的行是注释,会被解释器忽略。
现在(理论上)已经介绍了Python内实现算法的大部分内容。接下来增加一些基本的用户交互。为了(从命令提示符)获取用户输入,可以使用内建的input函数:
x = input("Please enter a number: ") print "The square of that number is ", x*x
input 函数会显示(可选的)给定的提示符,并且让用户输入任何合法的Python值。本例中,我们期望的是数字。如果输入了其他的类型值(比如字符串),程序会以一个错误信息终止。为了避免出现这种情况,需要增加一些错误检查机制。这里我先不介绍,我们先假设想让程序将用户的输入以字符串形式 逐字地 返回,(这样就可以输入任何值),可以使用raw_input函数。如果想要将输入字符串s转换为整数,可以使用int(s)。
注意:如果想要使用input输入一个字符串,那么用户需要显式地写出引号。在Python中,字符串可以用单、双引号括起。在Python3.0中,原始的input方法被取消了,而raw_input被重命名为input,请参见附录D
获取Python3.0的更多信息。
刚刚介绍了控制结构、输入和输出——现在来看看“华丽的”数据结构。其中最重要的算是列表和字典。列表用 中括号 实现,可以(很自然地)进行嵌套:
name = ["Cleese", "John"] x = [[1, 2, 3], [y, z], [[[]]]]
列表最棒的地方之一就是可以单独访问它的元素,也可以通过 索引 以及 分片 分组访问。索引访问(和很多其他语言一样)是在列表后加上以中括号括起来的索引值实现的(注意,第一个元素的索引为0)。
print name[1], name[0] # Prints "John Cleese" name[0] = "Smith"
分片基本上和索引一样,不过可以表示结果的起始和结束索引,使用冒号(:)进行分隔;
x = ["SPAM", "SPAM", "SPAM", "SPAM", "SPAM", "eggs", "and", "SPAM"] print x[5:7] # Prints the list ["eggs", "and"]
注意,结尾索引是不包含在结果内的。如果不写明两个索引中的一个,那么程序会假定需要那个方向的所有元素。换句话说,分片x[:3]意为“x中从开始到3号元素之间的所有元素,不包括3号元素”(也可以说表示第4个元素,因为是从0开始计数的)。分片x[3:]则表示“x中从3号元素(包括)开始到结尾之间的所有元素”。真正有意思的是,分片操作也可以使用负数:x[-3]表示倒数第3个元素。
那么,现在说说字典。简单来说,它们类似于列表,但内容是无序的。那么怎么进行索引呢?每个元素都有一个键 ,或称名称,它用类似于真正字典的方式查找元素。下面的例子演示了用于创建字典的语法:
phone = { "Alice": 23452532, "Boris" : 252336, "Clarice": 2352525, "Doris": 23624643 } person = {‘first name‘: "Robin", ‘last name‘: "Hood", ‘occupation‘: "Scoundrel"}
现在要获得person的职业(occupation)的话,可以使用表达式person["occupation"]。如果想要改变的 姓,可以像下面这样做:
person[‘last name‘] = "of Locksley"
很简单吧?字典类似于列表,也可以包含其他字典。当然,字典也能包含列表。同样地,列表也能包含字典。这样一来,就可以轻松创建一些很高级的数据结构了。
A.2 函数
下一步就是抽象。这个过程类似于给一段代码起个名字,并且利用一些参数调用它。换句话说,就是定义一个函数,也叫做过程(procedure)。很简单,像下面这样,使用关键字def:
def square(x): return x*x print square(2) # 打印4
return语句用来从函数返回值。
在一个函数传递参数时,同时也就将参数绑定到了值上,也就创建了新的引用。这就意味着可以在函数内部直接修改原始值。但是如果将参数名引用到其他值上面(重绑定),那么这个修改就不会影响到原来的变量。这种工作方式类似于Java。让我们看下面的这个例子:
def change(x): x[1] = 4 y = [1, 2, 3] change(y) print y # Prints out [1, 4, 3]
你看到了,传入的是原始列表,如果函数对其进行了修改,那么这些修改也会传递到调用函数的地方。不过请注意下面例子的行为,函数体 重绑定 了参数:
def nochange(x): x = 0 y = 1 nochange(y) print y # 打印1
为什么y没变?因为函数没有改变这个值!传入的值是1——不能用更改列表的方式更改一个数字。数字1就是(也永远是)数字1.我所做的是改变参数x的值的引用,这样不会影响到调用。
Python 有各种各样的参数,例如命名的参数(named argument)和默认值参数(default argument),它们可以处理一个函数的多个参数。请参见第6章获取这部分更多信息。
如果知道如何使用函数,那么刚才所讲到的基本上就是在Python内需要知道的。
不过了解“Python的函数是值”这个概念可能会比较有用。如果有一个square的函数,那么可以像下面这样做:
queeble = square print queeble(2) # 打印 4
为了能不用参数调用函数,必须记得要写成doit()而不是doit。后者只会将函数本身作为值返回。对于对象中的方法也是如此。方法将在下一节讲到。
A.3对象和相关内容
学习下面的内容前,假设读者已经了解面向对象程序设计的工作原理(否则这一章就没多大意义了。不过不懂没有关系,可以不使用对象,或者参见第7章)。
在Python中,可以使用class关键字定义类,像下面这样:
class Basket: # 不要忘记self参数 def __init__(self, contents=None): self.contents = contents or [ ] def add(self, element): self.contents.append(element) def print_me(self): result = "" for element in self.contents: result = result + " " + repr(element) print "Contains: " + result
上面例子中有些值得注意的的方面。
? 方法这样调用:
object.method(arg1, arg2)
? 有些参数是可选的,并且被赋予了默认值(在A.2节提到过),通过下面这样定义函数而实现:
def spam(age=32): …
? 这里的spam函数可以使用1个或0个参数调用。如果不使用参数进行调用,那么参数age会使用默认值32。
? repr函数将对象转换 为它的字符串表达形式(如果element包括数字1,那么repr(element)就等同于“1”,这里的“element”是字面量字符串)。
Python内的方法或成员变量(特性)都是无保护的(也不是私有的)。封装更像是一种编程风格(如果真的需要的话,也可以使用一些命名约定实现私有化,比如使用单或双下划线作为名称前缀)。
现在来谈谈短路逻辑.......
Python 内所有的值都可以用做逻辑值。那么空值,比如False、[ ]、0、 " " 、None表示逻辑假,而其他值(比如True、[0]、1和 "Hello, world" 表示逻辑真。
逻辑表达式,比如a and b是这样计算的:
? 检查a是否为真。
? 如果答案是否定的,那么直接返回a。
? 如果为真,那么直接返回b(表示表达式中的真值)。
相应的a or b的逻辑就是这样的:
? 如果a为真,那么返回a。
? 否则返回b。
短路机制让你可以像实现布尔运算符那样使用and或这or,同时也允许程序员编写短小精干的条件表达式。比如如下语句:
if a: print a else: print b
可以写为如下形式:
print a or b
事实上,这是Python的一种习惯用语,最好还是能习惯它。
注意:在Python 2.5中,已经引入了真正的条件表达式,所以你可以写成这种形式:
print a if a else b
Basket构造函数(Basket.__init__)使用这个策略处理默认参数。参数contents的默认值是None(也就是假),那么要检查它是否包含一个值的时候,可以写成如下形式:
if contents: self.contents = contents else: self.contents = [ ]
而构造函数只用了一条语句:
self.contents = contents or [ ]
为什么不把[ ]的默认值放在前面呢?这是Python工作方式的原因,它会给所有Basket实例赋予一个同样的空列表作为默认内容。某个实例开始填充数据,它们会包含同样的元素,而默认的也不再是空列表。想要学习这方面的更多的知识的话,请参见第5章内有关一致性(identity)和相等性(equality)区别的讨论。
注意:
当Basket.__init__等方法使用None作为占位符时,使用contents
is None作为条件,比只检查参数的布尔值要安全,因为这样做允许传入类似于空列表这样的假值(到对象外可以保留一个引用的地方)。
如果将空列表作为默认值使用,像下面这样做,避免在实例间共享内容的问题:
def __init__(self, contents=[ ]) self.contents = contents[:]
能猜到它是如何工作的吗?并不是每个地方都使用同一个空列表,而是使用contents[:]表达式创建了一个副本(也就是对整个列表进行分片)。
那么为了创建一个Basket对象并使用它(调用给它的一些方法),可以像下面这样做:
b = Basket([‘apple‘, ‘orange‘]) b.add("lemon") b.print_me()
这样会打印Basket的内容——一个apple(苹果),一个orange(桔子)和一个lemon(柠檬)。
除了__init__外还有一些魔法方法。比如__str__方法,它定义对象作为字符串时候输出。可以用它来替代print_me:
def __str__(self): result = " " for element in self.contents: result = result + " " +repr(element) return "Contains: " + result
如果想打印b,那么只要像下面这样:
print b
很酷吧?
像下面这样实现子类化(继承):
class SpamBasket(Basket): # …
Python 允许多继承,所以可以在圆括号内用逗号隔开多个超类。类像这样初始化:
x = Basket()
而构造函数像我说过的一样,通过定义特殊的成员函数__init__而得到的。假设SpamBasket有个__init__(self, type)构造函数,那么就能实现一个SpamBasket对象:
y = SpamBasket("apple")
如果在SpamBasket的构造函数中,需要调用一个或者多个超类的构造函数,可以这样调用:Basket.__init__(self)。注意,除了要提供一般的参数外,还要显式地提供self参数,因为超类的__init__不知道它正在处理哪个实例。
有关更多Python中面向对象程序设计的知识,请参见第7章。
A.4 其他琐碎知识
让我们在结束这个附录前快速地回顾一些有用的东西。大多数有用的函数和类都在模块中,它们是真正的以.py作为扩展名并包括Python代码的文本文件。读者可以在自己的程序中导入进行使用,比如要使用标准模板math中的sqrt函数,即可以像下面这样编写代码:
import math x = sqrt(y)
也可以像下面这样:
from math import sqrt x = sqrt(y)
有关更多标准库模块的信息,请参见第10章。
所有模块/脚本内的代码都会在导入的时候运行。如果想让你的程序既是可以导入的模块,又是可以运行的程序,可以在末尾加入下面这行:
if __name__ == "__main__": main()
这个方法很美妙,如果模块作为可执行脚本运行(也就是并不导入到其他脚本中),那么函数main会被调用。当然,可以在main函数内可以做任何事。
而如果想要在UNIX内创建可执行脚本的话,可以使用下面这行代码让脚本自己运行:
#!/usr/bin/env python
最后,简单地介绍一个重要概念:异常。有些操作(类似于除0或者从不存在的文件中读取数据)会产生一个错误状况,或者说异常。你可以创建自定义异常,让它们在适合的时间引发它们。
如果对于异常什么都不做,程序会结束,并且打印错误信息。不过可以使用try/except语句避免这种情况。比如:
def safe_division(a, b): try: return a/b except ZeroDivisionError: pass
ZeroDivisionError是个标准的异常。本例中,可以检查b是否为0,但是很多情况下,这个方法行不通。除此之外,如果在safe_division中,移除了try/except语句的话,会让它变成一个调用时带有风险的函数(就变成unsafe_division了),仍然可以像下面这样做:
try: unsafe_division(a, b) except: print "Something was divided by zero in unsafe division."
本例中,一般来说不会看到具体的问题,但是它可能发生,使用异常可以避免将时间浪费在无谓的测试上。
那么,就是这样了,希望各位读者有收获。开始编程吧。要记得Python的学习箴言:使用源代码(就是说要阅读能得到的所有代码)。