python基础速成 / 憋错料

一、基础模块

def prt(age,name):#函数定义

print("%s is %d 年龄 old"%(name,age))

if __name__=="__main__":#程序入口

print("Hello World")

prt(45,"gaici")

获取输入：使用input()函数

name=input("you name ？")

python的文件类型主要分为3类，分别是源代码、字节代码和优化代码。

1、源代码：文件以“py”为扩展名，“pyw”是图形用户接口的源文件的扩展名。

2、字节代码：python源文件经过编译后生成扩展名为"pyc"的文件，此文件是与平台无关的,可通过脚本生成该类型的文件。

import py_compile

py_compile.compile("ps.py")

运行后即可得到ps.pyc文件

3、优化代码：经过优化的源文件生成扩展名为“pyo”,该类型的文件需要命令行工具生成。

在命令行中输入“python2.7 -O -m py_compile ps.py”生成文件为ps.pyo而

"python3.5 -O -m py_compile ps.py"生成的文件为ps.pyc

类的私有变量、私有方法以两个下划线作为前缀。

class Student: #类名首字母大写

__name="" #私有实例变量前必须有2个下划线

def __init__(self,name): #构造函数

self.__name=name #self相当于Java中的this

def getName(self): #方法名首字母小写，其后每个单词的首字母用大写

return self.__name

def __del__(self): #析构函数

self.__name=None

if __name__=="__main__":

student=Student("borphi") #对象名用小写字母

print(student.getName())

注：python对代码缩进的要求非常严格。如果程序中不采用代码缩进的编码风格，将抛出一个IndentationError异常。

模块是类或函数的集合，用于实现某个功能。在Python中，如果需要在程序中调用标准库或其他第三方库的类时，需要先使用import或from ... import语句导入相关的模块。

1、import语句如：import sys

2、from ... import ...:在当前程序的命名空间中创建导入模块的引用。如：from sys import path

函数之间或类的方法之间用空行分隔，表示一段新的代码的开始。与缩进不同，空行并不是python语法的一部分。只是为增加程序可读性而已。

python以“#”作为注释，特殊的注释有：

1、中文注释 #-*-coding:UTF-8-*-

2、跨平台注释 #! /usr/bin/python

python也支持分号，但可以省略，python主要通过换行来识别语句的结束。python同样支持多行写一条语句，使用“\”作为换行符。

如：

sql="select id,name" \

"from dept" \

"where name=‘A"

局部变量是只能在函数或代码段内使用的变量。python并没有提供定义常量的保留字。

python中的字符串，可以用单引号、双引号和三引号来包括。其中三引号保持字符原样输出，不做任何处理。

python内置的几种数据结构：元组、列表、字典和序列。

1、元组(Tuple)：元组由不同的元素组成，每个元素可以存储不同类型的数据，元组是“写保护”的，即元组创建后不能再做任何修改操作，也不能添加或删除任何元素。元组通常代表一行数据，而元组中的元素代表不同的数据项。tuple_name=(元素1，元素2，...)元组的访问可以通过索引访问。

元组的遍历需要用到range()和len()这两个函数

tuple=(("apple","banana"),("grape","orange"),("watermelon",),("grapefruit",))

for i in range(len(tuple)):

print("tuple[%d]:"%i,"")

for j in range(len(tuple[i])):

print(tuple[i][j], "")

2、列表(List):通常作为函数的返回类型，可以实现添加(append())、删除(remove())和查找(index())操作，元素的值可以被修改。list_name=[元素1，元素2，...]

list0=["apple","banana","grape","orange"]

list0.append("watermelon")

list0.insert(1,"grapefruit")

list0.remove("banana") #如果列表中存在2个相同的元素，只删除位置靠前的。

print(list0.pop())

print(list0[-2])

print(list0[1:3])

print(list0[-3:-1])

print(list0.index("grape"))

print("orange" in list0)

list0.sort()

list0.reverse()

list1=[["apple","banana"],["grape","orange"],["watermelon"],["grapefruit"]]

for i in range(len(list1)):

print("list[%d]:"%i,"")

for j in range(len(list1[i])):

print(list1[i][j])

list0.extend(list1)

list0=list0+list1

list3=["apple","banana"]*2

print(list3)

注：用列表可以实现堆栈（append()、pop()）和队列（append()、pop(0)）

3、字典(Dictionary):字典是由“键-值”对组成的集合，字典中的“值”通过“键”来引用。dictionary_name={key1:value1,key2:value2, ... }

注意：字典的书写顺序不是字典实际存储顺序，字典根据每个元素的Hashcode值进行排列。

dict={"a":"apple","b":"banana","g":"grape","o":"orange"} #创建

dict["w"]="watermelon" #添加

del(dict["a"]) #删除

dict["g"]="grapefruit" #修改

print(dict.pop("b"))

dict.clear()

#字典的遍历

for k in dict:

print("dict[%s]="%k,dict[k])

print(dict.items())#返回由元组组成的列表

for (k,v) in dict.items():

print("dict[%s]="%k,v)

print(dict.keys())#输出key的列表

print(dict.values())#输出value的列表

4、序列：具有索引和切片能力的集合，元组、列表和字符串都属于序列。

包、模块、函数

python的程序由包(package)、模块(module)和函数组成。包是一系统模块组成的集合。模块是处理某一类问题的函数和类的集合。

包是一个完成特定任务的工具箱，python提供了许多有用的工具包，如字符串处理、图形用户接口、Web应用、图形图像处理等。

注意：包必须至少含有一个__init__.py文件，该文件内容可以为空。__init__.py用于标识当前文件夹是一个包。

1、模块把一组相关的函数或代码组织到一个文件中。一个Python文件即是一个模块。模块由代码、函数或类组成。

当python导入一个模块时，python首先查找当前路径，然后查找lib目录、site-package目录(python\lib\site-packages)和环境变量PYTHONPATH设置的目录。

模块导入

import 模块名

导入模块一次与多次的意义是一样的。

重新导入：hello=reload(hello)

如果不想在程序中使用前缀符，可以使用from ... import ...语句将模块导入。

from module_name import function_name

模块的属性

模块有一些内置属性，用于完成特定的任务，如__name__、__doc__。每个模块都有一个名称。例如，__name__用于判断当前模块是否是程序的入口，如果当前程序正在被使用，__name__的值为“__main__”。通常给每个模块都添加一个条件语句，用于单独测试该模块的功能。例如，创建一个模块myModule:

if __name__=="__main__":

print("myModule作为主程序运行")

else:

print("myModule被另一个模块调用")

__doc__可以输出文档字符串的内容。

模块内置函数：

1、apply():可以实现调用可变参数列表的函数，把函数的参数存放在一个元组或序列中。

apply(func [,args [,kwargs]])

2、filter():可以对某个序列做过滤处理，对自定义函数的参数返回的结果是否为“真”来过滤，并一次性返回处理结果

filter(func or None,sequence) -> list, tuple, or string

3、reduce():对序列中元素的连续操作可以通过循环来处理。

reduce(func,sequence[,initial])->value

4、map()：多个序列的每个元素都执行相同的操作，并组成列表返回。

map(func,sequence[,sequence, ...]) ->list

2、自定义包

包就是一个至少包含__init__.py文件的文件夹。例如，定义一个包parent，parent包中包含2个子包pack和pack2。pack包中包含myModule模块，pack2包中包含myModule2模块。

pack包的__init__.py

__all__=["myModule"] #用于记录当前包所包含的模块，如果模块多于2个，用逗号分开。这样就可在调用时一次导入所有模块

if __name__=="__main__":

print("作为主程序运行")

else:

print("pack初始化")

pack包的myModule.py

def func():

print("pack.myModule.func()")

if __name__=="__main__":

print("myModule作为主程序运行")

else:

print("myModule被另一个模块调用")

pack2包__init__.py

__all__=["myModule2"] #用于记录当前包所包含的模块，如果模块多于2个，用逗号分开。这样就可在调用时一次导入所有模块

if __name__=="__main__":

print("作为主程序运行")

else:

print("pack2初始化")

包pack2的myModule2：

def func():

print("pack2.myModule.func2()")

if __name__=="__main__":

print("myModule2作为主程序运行")

else:

print("myModule2被另一个模块调用")

parent模块调用:

from pack import *

from pack2 import *

myModule.func()

myModule2.func2()

3、函数

定义：

def 函数名(参数1[＝默认值1],参数2[=默认值2] ...):

...

return 表达式

调用：

函数名(实参1, 实参2, ...)

注意：实参必须与形参一一对应，如果参数提供默认值，顺序可以不一致。

python中的任何变量都是对象，所以参数只支持引用传递的方式。即形参和实参指向内存的同一个存储空间。

python不仅支持函数体内的嵌套，还支持函数定义的嵌套。

函数嵌套的层数不宜过多，就控制在3层以内。

# 嵌套函数

def func():

x=1

y=2

m=3

n=4

def sum(a,b): # 内部函数

return a+b

def sub(c,d): # 内部函数

return c-d

return sum(x,y)*sub(m,n)

print(func())

注意：尽量不要在函数内部定义函数。

lambda函数

lambda函数用于创建一个匿名函数。

func=lambda 变量1, 变量1, ... : 表示式

调用：func()

# lambda

def func():

x=1

y=2

m=3

n=4

sum=lambda a,b:a+b

sub=lambda c,d:c-d

return sum(x,y) * sub(m,n)

print(func())

注意：lambda也称之为表达式，只能使用表达式，不能使用判断、循环等多重语句。

Generator函数

生成器（Generator）的作用是一次产生一个数据项，并把数据项输出。可以用在for循环中遍历。Generator函数所具有的每次返回一个数据项的功能，使得迭代器的性能更佳。定义如下：

def 函数名(参数列表):

...

yield 表达式

Generator函数的定义与普通函数的定义没有什么区别，只要在函数体内使用yield生成数据项即可。

Generator函数可以被for循环遍历，而且可以通过next()方法获得yield生成的数据项。

# 定义Generator函数

def func(n):

for i in range(n):

yield i

#在for循环中输出

for i in func(3):

print(i)

#使用next()输出

r=func(3)

print(r.__next__())

注意：yield保留字与return语句的返回值和执行原理并不相同。yield生成值并不会中止程序的执行，返回值继续往后执行。return返回值后，程序将中止执行。

字符串

1、字符串格式化

Python将若干值插入到带“%”标记的字符串中，语法如下

"%s" % str1

"%s %s"% (str1,str2)

注意：如果要格式化多个值，元组中元素的顺序必须和格式化字符串中替代符的顺序一致。

Python格式化字符串的替代符及其含义

注意：如果要在字符串中输出“%”，则需要使用“%%”。

2、字符串的转义符

Python中转义字符的用法与Java相同，都是使用“\”作为转义字符。

Python的转义字符及其含义

注意：如果要在字符串中输出"\"，需要使用“\\”

3、字符串合并

Python使用“+”连接不同的字符串，如果两侧都是字符串，执行连接操作，如果两侧都是数字类型，则执行加法运算；如果两侧类型不同，则抛出异常：TypeError

4、字符串的截取

Python字符串内置了序列，可以通过“索引”、“切片”获取子串，也可以使用函数split来获取。

切片的语法格式如下所示：string[start:end:step]

5、字符串的比较

Python直接使用“==”、“！=”运算符比较两个字符串的内容。startswith()、endswith()

6、字符串反转

Python使用列表和字符串索引来实现字符串的反转，并通过range()进行循环。

# 循环输出反转的字符串

def reverse(s):

out=""

li=list(s)

for i in range(len(li),0,-1):

out+="".join(li[i-1])

return out

利用序列的“切片”实现字符串反转最为简洁：

# 循环输出反转的字符串

def reverse(s):

return s[::-1]

7、字符串的查找和替换

查找：find()、rfind()

替换：replace()：不支持正则

8、字符串与日期转换

Python提供了time模块处理日期和时间

从时间到字符串的转换strftime(),格式：strftime(format[,tuple])->string

格式化日期常用标记

字符串到日期的转换：需要进行两次转换，使用time模块和datetime类。转换过程分为3个步骤。

（1）、调用函数strptime()把字符串转换为一个元组，进行第一次转换，格式如下

strptime(string,format)->struct_time

（2）、把表示时间的元组赋值给表示年、月、日的3个变量

（3）、把表示年、月、日的3个变量传递给函数datetime(),进行第2次转换，格式如下

datetime(year,month,day[,hour[,minute[,second[,microsecond[,tzinfo]]]])

正则表达式

1、基础

正则表达式中的特殊字符

正则表达式中的常用限定符

限定符与“？”的组合

2、使用syt.re模块处理正则表达式

re模块的规则选项

pattern对象的属性和方法

match对象的方法和属性

类与对象

1、类

定义：

class Fruit:

def grow(self): #类的方法必须有1个self参数，但是方法调用时可以不传这个参数

print("Fruit grow ...")

if __name__=="__main__":

fruit=Fruit()

fruit.grow()

2、对象的创建

if __name__=="__main__":

fruit=Fruit()

fruit.grow()

属性和方法

1、python类的属性分为私有属性和公有属性，但python并没有提供公有属性和私有属性的修饰符。类的私有属性不能被该类之外的函数调用，类属性的作用范围完全取决于属性的名称。如果函数、方法或属性的名字以两个下划线开始，则表示私有类型；没有使用两个下划线开始则表示公有属性。

python的属性分为实例属性和静态属性。实例属性是以self作为前缀的属性。__init__方法即Python类的构造函数。如果__init__方法中定义的变量没有使用self作为前缀声明，则该变量只是普通的局部变量。在python中静态变量称之为静态属性。

class Fruit:

price=0 #类属性

def __init__(self):

self.color="red" #实例属性

zone="China" #局部变量

if __name__=="__main__":

print(Fruit.price)

apple=Fruit()

print(apple.color)

Fruit.price=Fruit.price+10

print("apple‘s price:"+str(apple.price))

banana=Fruit()

print("banana‘s price:" + str(banana.price))

注意：Python的类和对象都可以访问类属性。

python提供了直接访问私有属性的方式，可用于程序的测试和调试，访问的格式如下：

instance_classname_attribute #instance表示对象；classname表示类名；attribute表示私有属性。

class Fruit:

def __init__(self):

self.__color="red" #私有属性

if __name__=="__main__":

apple=Fruit()

print(apple._Fruit__color)

类提供了一些内置属性，用于管理类的内部关系。如，__dict__、__bases__、__doc__等

2、类的方法

类的方法也分为公有方法和私有方法。私有函数不能被该类之外的函数调用，私有方法也不能被外部的类或函数调用。Python使用函数staticmethod()或"@staticmethod"指令的方式把普通函数转换为静态方法。Python的静态方法并没有和类的实例进行名称绑定，Python的静态方法相当于全局函数。

class Fruit:

price = 0

def __init__(self):

self.__color="red" #私有属性

def getColor(self):

print(self.__color)

@staticmethod

def getPrice():

print(Fruit.price)

def __getPrice():

Fruit.price=Fruit.price+10

print(Fruit.price)

count=staticmethod(__getPrice)

if __name__=="__main__":

apple=Fruit()

apple.getColor()

Fruit.count()

banana = Fruit()

Fruit.count()

Fruit.getPrice()

Python中还有一种方法称之为类方法。类方法的作用与静态方法相似，都可以被其它实例对象共享，不同的是类方法必须提供self参数。类方法可以使用函数classmethod()或“@classmethod”指令定义。

class Fruit:

price = 0

def __init__(self):

self.__color="red" #私有属性

def getColor(self):

print(self.__color)

@classmethod

def getPrice(self):

print(self.price)

def __getPrice(self):

self.price=self.price+10

print(self.price)

count=classmethod(__getPrice)

if __name__=="__main__":

apple=Fruit()

apple.getColor()

Fruit.count()

banana = Fruit()

Fruit.count()

Fruit.getPrice()

如果某个方法需要被其他实例共享，同时又需要使用当前实例的属性，则将其定义为类方法。

3、内部类的使用

内部类中的方法可以使用两种方法调用

第一种方法是直接使用外部类调用内部类，生成内部类的实例，再调用内部类的方法，调用格式如下所示：

object_name=outclass_name.inclass_name()

object_name.method()

第二种方法是先对外部类进行实例化，然后再实例化内部类，最后调用内部类

out_name=outclass_name()

in_name=out_name.inclass_name()

in_name.method()

内部类使用方法：

class Car:

class Door: #内部类

def open(self):

print("open door")

class Wheel: #内部类

def run(self):

print("car run")

if __name__=="__main__":

car=Car()

backDoor=Car.Door() #内部类的实例化方法一

frontDoor=car.Door() #内部类的实例化方法二

backDoor.open()

frontDoor.open()

wheel=Car.Wheel()

wheel.run()

4、__init__方法

python的构造函数名为__init__。__init__方法除了用于定义实例变量外，还用于程序的初始化。__init__方法是可选的，如果不提供__init__方法，Python将会给出一个默认的__init__方法。

5、__del__方法

Python提供了析构函数__del__()。析构函数可以显式的释放对象占用的资源，析构函数也是可选的，如果程序不提供析构函数，Python会在后台提供默认的析构函数。

如果要显式的调用析构函数，可以使用del语句，在程序的末尾添加如下语句

del fruit #执行析构函数

6、垃圾回收机制

Python也采用垃圾回收机制清除对象，Python提供了gc模块释放不再使用的对象。垃圾回收的机制有许多种算法，Python采用的是引用计算的方式。函数collect()可以一次性收集所有待处理的对象。

import gc

class Fruit:

def __init__(self,name,color): #初始化name,color属性

self.__name=name

self.__color=color

def getColor(self):

return self.__color

def setColor(self,color):

self.__color=color

def getName(self):

return self.__name

def setName(self,name):

self.__name=name

class FruitShop: #水果店类

def __init__(self):

self.fruits=[]

def addFruit(self,fruit): #添加水果

fruit.parent=self #把Fruit类关联到FruitShop类

self.fruits.append(fruit)

if __name__=="__main__":

shop=FruitShop()

shop.addFruit(Fruit("apple","red"))

shop.addFruit(Fruit("banana", "yellow"))

print(gc.get_referents(shop))

del shop

print(gc.collect()) #显式调用垃圾回收器

7、类的内置方法

__new__()

__new__()在__init__()之前调用，用于生成实例对象。利用这个方法和类属性的特性可以实现设计模式中的单例模式。

class Singleton(object):

__instance=None #定义实例

def __init__(self):

pass

def __new__(cls, *args, **kwargs): #在__init__之前调用

if Singleton.__instance is None: #生成唯一实例

Singleton.__instance=object.__new__(cls,*args,**kwargs)

return Singleton.__instance

8、方法的动态特性

Python作为动态脚本语言，编写的程序具有很强的动态性。可以动态添加类的方法，把某个已经定义的函数添加到类中。添加新方法的语法格式如下所示：

class_name.method_name=function_name

注意：function_name表示一个已经存在的函数

class Fruit:

pass

def add(self):

print("grow ...")

if __name__=="__main__":

Fruit.grow=add()

fruit=Fruit()

fruit.grow()

继承

Python不提倡过度包装。继承可以重用已经存在的数据和行为，减少代码的重复编写。Python在类名后使用一对括号表示继承关系，括号中的类即为父类。如果父类定义了__init__方法，子类必须显式调用父类的__init__方法。如果子类需要扩展父类的行为，可以添加__init__方法的参数。

class Fruit():

def __init__(self,color):

self.color=color

print("fruit‘s color:%s"%self.color)

def grow(self):

print("grow ...")

class Apple(Fruit):

def __init__(self,color):

Fruit.__init__(self,color)

print("apple‘s color:%s"%self.color)

class Banana(Fruit):

def __init__(self,color):

Fruit.__init__(self,color)

print("banana‘s color:%s"%self.color)

def grow(self):

print("banana grow ...")

if __name__=="__main__":

apple=Apple("red")

apple.grow()

banana=Banana("yellow")

banana.grow()

还可以使用super类的super()调用父类的__init__方法。super()可以绑定type类的父类。

super(type,obj)

class Fruit(object):

def __init__(self):

print("parent")

class Apple(Fruit):

def __init__(self):

super(Apple, self).__init__()

print("apple child")

if __name__=="__main__":

Apple()

注意：super类的实现代码继承了object，因此Fruit类必须继承object.如果不继承object，使用super()将出现错误。

python没有提供对接口的支持。

运算符的重载

Python把运算符和类的内置方法关联起来，每个运算符都对应1个函数。

class Fruit:

def __init__(self,price=0):

self.price=price

def __add__(self, other): #重载加号运算符

return self.price+other.price

def __gt__(self, other): #重载大于运算符

if self.price>other.price:

flag=True

else:

flag=False

return flag

class Apple(Fruit):

pass

class Banana(Fruit):

pass

python工厂方法模式

工厂方法类图

实现方法

class Factory: #工厂类

def createFruit(self,fruit): #工厂方法

if fruit=="apple":

return Apple()

elif fruit=="banana":

return Banana()

class Fruit:

def __str__(self):

return "fruit"

class Apple(Fruit):

def __str__(self):

return "apple"

class Banana(Fruit):

def __str__(self):

return "banana"

if __name__=="__main__":

factory=Factory()

print(factory.createFruit("apple"))

print(factory.createFruit("banana"))

异常处理与程序调试

Python中的异常类定义在exceptions模块中，并继承自基类BaseException。BaseException类是属于new-style class，BaseException类下有3个子类，分别是Exception、KeyboardInterrupt、SystemExit。

Exception类是最常用的异常类，该类包括StandardError、StopIteration、GeneratorExit、Warning等异常类。

BaseException

+-- SystemExit

+-- KeyboardInterrupt

+-- GeneratorExit

+-- Exception

+-- StopIteration

+-- StopAsyncIteration

+-- ArithmeticError

| +-- FloatingPointError

| +-- OverflowError

| +-- ZeroDivisionError

+-- AssertionError

+-- AttributeError

+-- BufferError

+-- EOFError

+-- ImportError

+-- LookupError

| +-- IndexError

| +-- KeyError

+-- MemoryError

+-- NameError

| +-- UnboundLocalError

+-- OSError

| +-- BlockingIOError

| +-- ChildProcessError

| +-- ConnectionError

| | +-- BrokenPipeError

| | +-- ConnectionAbortedError

| | +-- ConnectionRefusedError

| | +-- ConnectionResetError

| +-- FileExistsError

| +-- FileNotFoundError

| +-- InterruptedError

| +-- IsADirectoryError

| +-- NotADirectoryError

| +-- PermissionError

| +-- ProcessLookupError

| +-- TimeoutError

+-- ReferenceError

+-- RuntimeError

| +-- NotImplementedError

| +-- RecursionError

+-- SyntaxError

| +-- IndentationError

| +-- TabError

+-- SystemError

+-- TypeError

+-- ValueError

| +-- UnicodeError

| +-- UnicodeDecodeError

| +-- UnicodeEncodeError

| +-- UnicodeTranslateError

+-- Warning

+-- DeprecationWarning

+-- PendingDeprecationWarning

+-- RuntimeWarning

+-- SyntaxWarning

+-- UserWarning

+-- FutureWarning

+-- ImportWarning

+-- UnicodeWarning

+-- BytesWarning

+-- ResourceWarning

StandardError类中常见的异常

Python使用try ...
exception语句捕获异常，异常类型定义在try子句的后面。

注意：如果在except子句后将异常类型设置为"Exception"，异常处理程序将捕获除程序中断外的所有异常，因为Exception类是其他异常类的基类。

try ... exception用法：

try:

file("hello.txt",‘r‘)

print(‘读文件‘)

except IOError:

print("文件不存在")

except:

print("程序异常")

else:

print("结束")

try ... finally用法

try:

f=file("hello.txt",‘r‘)

print(‘读文件‘)

except IOError:

print("文件不存在")

finally:

f.close()

使用raise抛出异常

可以通过raise语句显式引发异常。一旦执行了raise语句，raise语句后的代码将不能被执行。

try:

s=None

if s is None:

print("s 是空对象")

raise NameError

print(len(s))

except TypeError:

print("空对象没有长度")

自定义异常

自定义异常必须继承Exception类，自定义异常按照命名规范以"Error"结尾，使用raise引发，且只能通过手工方式触发

from __future__ import division

class DivisionException(Exception):

def __init__(self,Exception):

Exception.__init__(self,x,y)

self.x=x

self.y=y

if __name__=="__main__":

try:

x=3

y=2

if x%y>0:

print(x/y)

raise
DivisionException(x,y)

except DivisionException as div:

print("DivisionException:x/y=%.2f"%(div.x/div.y))

assert语句的使用

assert语句用于检测某个条件表达是否为真，又称断言语句

t=("hello")

assert len(t)>=1

注意：python支持形如"m<=x<=n"的表达式。

Python中的traceback对象可记录异常信息和当前程序的状态。当异常发生时，traceback对象将输出异常信息。异常信息应从下往上阅读。

python的数据库编程

Python提供了连接数据库的专用模块，不同的数据库可以使用相应的专用模块访问数据库。

1、cx_Oracle模块

python的cx_Oracle模块可以访问Oracle数据库。

cx_Oracle模块的下载地址：http://cx-oracle.sourceforge.net/

代码示例：

import cx_Oracle

connection=cx_Oracle.Connection("scott","tiger,","ORCL") #连接oracle数据库

cursor=connection.cursor() #获取cursor对象操作数据库

sql="";

cursor.execute(sql)

for x in cursor.fetvchall():

for value in x:

print(value)

cursor.close()

connection.close()

2、MySQLdb模块

MySQLdb模块是python操作MySQL数据库的。

代码示例

import os,sys

import MySQLdb

#连接数据库

try:

conn=MySQLdb.connect(host="localhost",user="root",passwd="",db="")

cursor=conn.cursor()

sql="insert into address(name,address) values (%s,%s)"

values=(("张三","北京海淀区"),("李四","北京海淀区"),("王五","北京海淀区"))

cursor.executemany(sql,values) #插入多条数据

except Exception as
e:

print(e)

sys.exit()

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

try:

sql=""

cursor.execute(sql) #查询数据

data=cursor.fetchall()

if data:

for x in data:

print(x[0],x[1])

cursor.close() #关闭游标

conn.close() #关闭数据库

except Exception as
e:

print(e)

3、SQLite数据库

#-*-coding:utf-8-*-

import sqlite3

#连接数据库

conn=sqlite3.connect("./address.db")

#创建表

conn.execute("create table if not exists address(id integer primary key autoincrement,name
VARCHAR(128),address VARCHAR (128))")

conn.execute("insert into address(name,address)
VALUES (‘Tom‘,‘Beijing road‘)")

conn.execute("insert into address(name,address)
VALUES (‘Jerry‘,‘Shanghai road‘)")

#手动提交数据

conn.commit()

#获取游标对象

cur=conn.cursor()

#使用游标查询数据

cur.execute("select * from address")

#获取所有结果

res=cur.fetchall()

print "address:",res

for line in res:

for f in line:

print f

#关闭连接

cur.close()

conn.close()

Python的持久化模块

python的标准库提供了几种持久化模块。这些模块可以模拟数据库的操作，会把数据保存在指定的文件中。例如dbhash、anydbm、shelve等模块。

1、dbhash模块读写数据

DBM是一种文件式数据库，采用哈希结构进行存储。是一种简单的数据库，并不具备管理能力，但是比普通文件更稳定、可靠，而且查询速度快。unix操作系统使用gdbm，而windows可以使用dbhash模块。

window环境下DBM数据库的读写操作

import dbhash

db=dbhash.open(‘temp‘,‘c‘) #创建并打开数据库

db["Tom"]="Beijing road"
#写数据

db["Jerry"]="Shanghai road"

for k,v in db.iteritems(): #遍历db对象

print(k,v)

if db.has_key("Tom"):

del db["Tom"]

print(db)

db.close() #关闭数据库

注意：dbhash模块返回字典的key、value值只支持字符串类型

为了统一不同操作系统对DBM数据库的要求，Python的anydbm模块提供了操作DBM数据库的一般性操作。其用法和dbhash模块类似。

2、shelve模块读写数据

shelve模块是Python的持久化对象模块，用法与anydbm模块的用法相似，但是shelve模块返回字典的value值支持基本的Python类型。

import shelve

addresses=shelve.open(‘addresses‘) #创建并打开数据库

addresses["1"]=["Tom","Beijing
road","2018-01-03"] #写数据

addresses["2"]=["Jerry","Shanghai
road","2008-03-30"]

if addresses.has_key("2"):

del addresses["2"]

print(addresses)

addresses.close() #关闭数据库

注意：shelve模块返回字典的key值只支持字符串类型

文件处理

文件通常用于存储数据或应用程序的参数。Python提供了os、os.path、shutil等模块用于处理文件。其中包括打开文件、读写文件、复制和删除文件等函数。

文件的处理一般分为以下3个步骤：

（1）创建并打开文件，使用file()函数返回一个file对象。

file(name[, mode[, buffering]])

文件打开的模式(mode)

参数	说明
r	以只读的方式打开文件
r+	以读写的方式打开文件
w	以写入的方式打开文件。先删除文件原有的内容，再重新写入新的内容。如果文件不存在，则创建1个新的文件。
w+	以读写的方式打开文件。先删除文件原有的内容，再重新写入新的内容。如果文件不存在，则创建1个新的文件。
a	以写入的方式打开文件，在文件的末尾追加新的内容。如果文件不存在，则创建1个新的文件.
a+	以读写的方式打开文件，在文件的末尾追加新的内容。如果文件不存在，则创建1个新的文件.
b	以二进制的模式打开文件。可与r、w、a、+结合使用
U	支持所有的换行符号。"\r"，"\n","\r\n"都表示换行

注意：对于图片、视频等文件必须使用"b"的模式读写

（2）调用file对象的read()、write()等方法处理文件。

（3）调用close()关闭文件，释放file对象占用的资源。

示例：

#创建文件

context=‘‘‘helloworld

hellochina

‘‘‘

f=open(‘hello.txt‘,‘w‘)#打开文件

f.write(context)#把字符串写入文件

f.close()#关闭文件

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

#按行读取方式：使用readline()读文件

f=open(‘hello.txt‘)

while True:

line=f.readline()

if line:

print(line)

else:

break

f.close()

#多行读取方式：使用readlins()读文件

f=open(‘hello.txt‘)

lines=f.readlines()

for line in lines:

print(line)

f.close()

#一次性读取方式：read()

f=open(‘hello.txt‘)

context=f.read()

print(context)

f.close()

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

#使用writelines()写文件

f=open(‘hello.txt‘,‘w+‘)

li=[‘helloworld\n‘,‘hellochina\n‘]

f.writelines(li)

f.close()

#使用write()写文件：追加新的内容到文件

f=open(‘hello.txt‘,‘a+‘)

new_context="goodbye"

f.write(new_context)

f.close()

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

文件的删除需要使用os模块和os.path模块。os模块提供了对系统环境、文件、目录等操作的系统级的接口函数。

os模块常用的文件处理函数

函数	说明
access(path,mode)	按照mode指定的权限访问文件
chmod(path,mode)	改变文件的访问权限，mode用UNIX系统中的权限代号表示
open(filename,flag[,mode=0777])	按照mode指定的权限打开文件，默认情况下，给所有用户读、写、执行的权限
remove(path)	删除path指定的文件
rename(old,new)	重命名文件或目录，old表示原文件或目录，new表示新文件或目录
stat(path)	返回path指定文件的所有属性
fstat(path)	返回打开的文件的所有属性
lseek(fd,pos,how)	设置文件的当前位置，返回当前位置的字节数
startfile(filepath[,operation])	启动关联程序打开文件。例如，打开的是1个html文件，将启动浏览器
tmpfile()	创建1个临时文件，文件创建在操作系统的临时目录中

os.path模块常用的函数

函数	说明
abspath(path)	返回path所在的绝对路径
dirname(p)	返回目录的路径
exists(path)	判断文件是否存在
getatime(filename)	返回文件的最后访问时间
getctime(filename)	返回文件的创建时间
getmtime(filename)	返回文件的最后修改时间
getsize(filename)	返回文件的大小
isabs(s)	测试路径是否为绝对路径
isdir(path)	判断path指定的是否为目录
isfile(path)	判断path指定的是否为文件
split(p)	对路径进行分割，并以列表的方式返回
splitext(p)	从路径中分割文件的扩展名
splitdrive(p)	从路径中分割驱动器的名称
walk(top,func,arg)	遍历目录树，与os.walk()的功能相同

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

#删除文件

importos

if os.path.exists(‘hello.txt‘):

os.remove(‘hello.txt‘)

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

file类没有提供直接复制文件的方法，但是可以使用read(),write()方法模拟实现文件复制功能。

#使用read()、write()实现拷贝

#创建文件hello.txt

src=open(‘hello.txt‘,‘w‘)

li=[‘helloworld\n‘,‘hellochina\n‘]

src.writelines(li)

src.close()

#把hello.txt拷贝到hello2.txt

src=open(‘hello.txt‘,‘r‘)

dst=open(‘hello2.txt‘,‘w‘)

dst.write(src.read())

src.close()

dst.close()

shutil模块是另一个文件、目录的管理接口，提供了一些用于复制文件、目录的函数。copyfile()函数可以实现文件的拷贝，copyfile()函数的声明如下：

copyfile(src,dst)

文件的剪切可以使用move()函数模拟，该函数声明如下：

move(src,dst)

#shutil模块实现文件的拷贝、移动

import shutil

shutil.copyfile(‘hello.txt‘,‘hello2.txt‘)

shutil.move(‘hello.txt‘,‘../‘)

shutil.move(‘hello2.txt‘,‘hello3.txt‘)

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

os模块的函数rename()可以对文件或目录进行重命名。

#修改文件名

import os

li=os.listdir(".")

print(li)

if "hello.txt" in li:

os.rename(‘hello.txt‘,‘hi.txt‘)

elif ‘hi.txt‘ in li:

os.rename(‘hi.txt‘,‘hello.txt‘)

#修改文件后缀（即扩展名）

import os

files=os.listdir(‘.‘)

for filename in files:

pos=filename.find(‘.‘)

if filename[pos+1:]==‘html‘:

newname=filename[:pos+1]+"htm"

os.rename(filename,newname)

#修改文件后缀（即扩展名）--简化版

import os

files=os.listdir(‘.‘)

for filename in files:

li=os.path.splitext(filename)

if li[1]==".html":

newname=li[0]+".htm"

os.rename(filename,newname)

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

#文件的查找

import re

f1=open(‘hello.txt‘,‘r‘)

count=0

for s in f1.readlines():

li=re.findall(‘hello‘,s)

if len(li)>0:

count+=li.count("hello")

print("查找到"+str(count)+"个hello")

f1.close()

#文件内容的替换

f1=open(‘hello.txt‘,‘r‘)

f2=open(‘hello2.txt‘,‘w‘)

for s in f1.readlines():

f2.write(s.replace("hello",‘hi‘))

f1.close()

f2.close()

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

python提供了模块difflib用于实现对序列、文件的比较。如果要比较2个文件，列出2个文件的异同，可以使用difflib模块的SequenceMatcher类实现。其中get_opcodes()可以返回2个序列的比较结果。调用get_opcodes之前，需要先生成1个SequenceMatcher对象。

#文件比较

import difflib

f1=open(‘hello.txt‘,‘r‘)

f2=open(‘hi.txt‘,‘r‘)

src=f1.read()

dst=f2.read()

print(src)

print(dst)

s=difflib.SequenceMatcher(lambda x:x=="",src,dst)

for tag,i1,i2,j1,j2 in s.get_opcodes():

print("%ssrc[%d:%d]=%sdst[%d:%d]=%s"%(tag,i1,i2,src[i1:i2],j1,j2,dst[j1:j2]))

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

python标准库ConfigParser模块用于解析配置文件。ConfigParser模块类可读取ini文件的内容

ODBC.ini

[ODBC 32 bit Data Sources]

MS Access Database=Microsoft Access Driver(*.mdb)(32)

Excel Files=Microsoft Excel Driver(*.xls)(32)

dBASE Files=Microsoft dBase Driver(*.dbf)(32)

[MSAccessDatabase]

Driver32=C:\WINDOWS\system32\odbcjt32.dll

[ExcelFiles]

Driver32=C:\WINDOWS\system32\odbcjt32.dll

[dBASEFiles]

Driver32=C:\WINDOWS\system32\odbcjt32.dll

#读取配置文件

import configparser

config=configparser.ConfigParser()

config.read("ODBC.ini")

sections=config.sections()#返回所有配置块的标题

print("配置块：",sections)

o=config.options("ODBC 32 bit Data Sources")#返回所有配置项的标题

print("配置项：",o)

v=config.items("ODBC 32 bit Data Sources")

print("内容：",v)

#根据配置块和配置项返回内容

access=config.get("ODBC 32 bit Data Sources","Ms Access Database")

print(access)

excel=config.get("ODBC 32 bit Data Sources","Excel Files")

print(excel)

dBASE=config.get("ODBC 32 bit Data Sources","dBASE Files")

2、配置文件写入

#写入配置文件

import configparser

config=configparser.ConfigParser()

config.add_section("ODBC Driver Count")#添加新配置块

config.set("ODBC Driver Count","count",2)#添加新的配置项

f=open("ODBC.ini",‘a+‘)

config.write(f)

f.close()

config.read("ODBC.ini")

3、修改配置文件

#修改配置文件

import configparser

config=configparser.ConfigParser()

config.read("ODBC.ini")

config.set("ODBC Driver Count","count",3)#修改配置项

f=open("ODBC.ini","r+")

config.write(f)

f.close()

4、删除配置块和配置项

#删除配置块和配置项

import configparser

config=configparser.ConfigParser()

config.read("ODBC.ini")

config.remove_option("ODBC Driver Count","count")#删除配置项

config.remove_section("ODBC Driver Count")#删除配置块

f=open("ODBC.ini","w+")

config.write(f)

f.close()

目录的基本操作

os模块提供了针对目录进行操作的函数

函数	说明
mkdir(path[,mode=0777])	创建path指定的1个目录（一次只能创建一个目录）
makedirs(name,mode=511)	创建多级目录，name表示为 "path1/path2/..."（一次可以创建多个目录）
rmdir(path)	删除path指定的目录（一次只能删除一个）
removedirs(path)	删除path指定的多级目录（一次可以删除多个目录）
listdir(path)	返回path指定目录下所有的文件名
getcwd()	返回当前的工作目录
chdir(path)	将当前目录改变为path指定的目录
walk(top,topdown=True,onerror=None	遍历目录树

import os

os.mkdir("hello")

os.rmdir("hello")

os.makedirs("hello/world")

os.removedirs("hello/world")

目录的遍历有3种实现方法--递归函数、os.path.walk()、os.walk()

#1、递归遍历目录

import os

def visitDir(path):

li=os.listdir(path)

for p in li:

pathname=os.path.join(path,p)

if not os.path.isfile(pathname):

visitDir(pathname)

else:

print(pathname)

if__name__=="__main__":

path=r"/Users/liudebin/资料"

visitDir(path)

#2、os.path.walk()

import os,os.path

def visitDir(arg,dirname,names):

for filepath in names:

print(os.path.join(dirname,filepath))

if__name__=="__main__":

path=r"/Users/liudebin"

os.path.walk(path,visitDir,())

#3、os.walk

def visitDir(path):

for root,dirs,files in os.walk(path):

for filepath in files:

print(os.path.join(root,filepath))

if__name__=="__main__":

path=r"/Users/liudebin"

visitDir(path)

注意：os.path.walk()与os.walk()产生的文件名列表并不相同：

os.path.walk()产生目录树下的目录路径和文件路径，而os.walk()只产生文件路径

文件和流

python隐藏了流的机制，在python的模块中找不到类似Stream类，python把文件的处理和流关联在一起，流对象实现了File类的所有方法。sys模块提供了3种基本的流对象---stdin、stdout、stderr。流对象可以使用File类的属性和方法，流对象的处理和文件的处理方式相同。

1、stdin

importsys

sys.stdin=open(‘ODBC.ini‘,‘r‘)

forlineinsys.stdin.readlines():

print(line)

2、stdout

importsys

sys.stdout=open(r‘ODBC.ini‘,‘a‘)

print("goodbye")

sys.stdout.close()

3、stderr

importsys,time

sys.stderr=open(‘record.log‘,‘a‘)

f=open(r"./hello.txt","r")

t=time.strftime("%Y-%m-%d%X",time.localtime())

context=f.read()

ifcontext:

sys.stderr.write(t+""+context)

else:

raise Exception(t+"异常信息")

python模拟Java输入、输出流

#文件输入流

def fileInputStream(filename):

try:

f=open(filename)

for line in f:

for byte in line:

yield byte

exceptStopIteration:

f.close()

return

#文件输出流

def fileOutputStream(inputStream,filename):

try:

f=open(filename,‘w‘)

while True:

byte=inputStream.next()

f.write(byte)

except StopIteration:

f.close()

return

if__name__=="__main__":

fileOutputStream(fileInputStream(‘hello.txt‘),‘hello2.txt‘)

示例：

#文件属性浏览

def showFileProperties(path):

"""显示文件的属性，包括路径、大小、创建日期，最后修改时间，最后访问时间"""

import time,os

for root,dirs,files in os.walk(path,True):

print("位置："+root)

for filename in files:

stats=os.stat(os.path.join(root,filename))

info="文件名："+filename+""

info+="大小："+("%dM"%(stats[-4]/1024/1024))+""

t=time.strftime("%Y-%m-%d%X",time.localtime(stats[-1]))

info+="创建时间："+t+""

t=time.strftime("%Y-%m-%d%X",time.localtime(stats[-2]))

info+="最后修改时间："+t+""

t=time.strftime("%Y-%m-%d%X",time.localtime(stats[-3]))

info+="最后访问时间："+t+""

print(info)

if __name__=="__main__":

path=r"/Users/liudebin/Downloads/第一二期/第二期"

showFileProperties(path)

注意：os.stat()的参数必须是路径

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

URL的解析

Python中用来对URL字符串进行解析的模块是urlparse。该模块主要的方法有urlparse、urljoin、urlsplit和urlunsplit等

在Python语言中，urlparse对于URL的定义采用的六元组，如下所示：

scheme://netloc/path;parameters?query#fragment

urlparse方法返回对象的属性

可以使用PyChecker和PyLine检查源代码。

使用Distutils可以让开发者轻松地用Python编写安装脚本。

日志记录可以使用标准库中的logging模块，基本用法很简单：

import logging

logging.basicConfig(level=logging.INFO,filename=‘mylog.log‘)

logging.info("Starting program")

logging.info("Trying to divide 1 by 0")

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

测试

在Python中代码测试包含两种类型：unittest和doctest

unittest模块：用来写PyUnit的测试代码。支持对软件代码的自动化测试。

doctest模块：可以直接在代码的注释中写测试用例。此模块将测试用例内置在了函数的文档字符串，从而达到了文档和测试代码的统一。

TDD(测试驱动开发)：基本思想是测试先行，在开发具体的功能代码之前，需要先编写此功能的测试代码。只有通过了测试的代码，才能够加入到代码仓库中。

#encoding=utf-8

importunittest

importstring

classStringReplaceTestCase1(unittest.TestCase):

"""测试空字符串替换"""

defrunTest(self):

src="HELLO"

exp="HELLO"

result=string.replace(src,"","")

self.assertEqual(exp,result)

srtc=StringReplaceTestCase1()

srtc.runTest()

在python语言中，可以用内置的assert语句来实现测试用例运行时候的断言。

unittest模块中的测试方法

时间： 2024-10-04 16:51:30

python基础速成

python基础速成的相关文章

linux+jmeter+python基础+抓包拦截

Python基础教程（第九章魔法方法、属性和迭代器）

Python基础入门 (一)

Python 基础 - Day 4 Learning Note - Generator 生成器

python基础教程（第二版）

python基础周作业

从零开始的Python爬虫速成指南

Python基础（二）

Python之路【第三篇】：Python基础（二）