1. 文件处理
1.1 文件处理流程
1.打开文件,得到文件句柄并赋值给一个变量
2.通过句柄对文件进行操作
3.关闭文件
1.2 文件读取模式r
r文本模式的读,在文件不存在,不会创建新文件
f = open(‘a.txt‘,‘r‘,encoding=‘utf-8‘) f.readable() # 判读文件是否可读 f.writable() # 判读文件是否可写 f.readline() # 一次读取一行 f.readlines() # 一次读取所有值 f.close()
1.3 文件读取模式rb
b模式直接从硬盘中读取bytes,不用指定编码格式;以什么格式存的文件,以什么格式读取文件
f = open(‘a.txt‘,‘rb‘) print(f.read().decode(‘utf-8‘)) f.close()
1.4 文本写模式 w
w文本模式的写,文件存在则清空,不存在则创建
f = open(‘a.txt‘,‘w‘,encoding=‘utf-8‘) f.writable() # 判断是否可写 f.readable() # 判断是否可读 f.write(‘你好‘) # 写单个值 f.writelines([‘aaa\n‘,‘bbb\n‘]) # 写列表 f.writelines((‘111\n‘,‘222\n‘)) # 写元组 f.close()
1.5 文件追加模式a
a 文件模式的追加,文件存在、光标跳到文件末尾,文件不存在创建
f = open(‘a.txt‘,‘a‘,encoding=‘utf-8‘) print(f.tell()) # 打印文件光标的位置 f.write(‘3333\n‘) f.write(‘4444\n‘) f.close()
1.6 混合模式
"+" 表示可以同时读写某个文件
r+ 可读写文件,即可读、可写、可追加
w+ 可写读文件,即可写、可读、可追加
a+ 同a
混合模式不常用,了解即可。
1.7 b模式
#rb模式直接从硬盘中读取bytes f = open(‘a.txt‘,‘rb‘) print(f.read()) f.close() #wb模式 f = open(‘a.txt‘,‘wb‘) f.write(‘你好‘.encode(‘utf-8‘)) f.close()
1.8 遍历文件
在内存中,同时只有一条内容,不依赖索引;文件很多,用循环遍历的方式读取文件。
with open(‘a.txt‘,‘r‘,encoding=‘utf-8‘) as f: for line in f.read(): print(line)
1.9 Copy文件
利用r模式,模拟Copy动作;以b的方式打开文件,不会涉及文件编码的问题,b是Bytes的格式;利用r进行处理文件路径,以后经常需要处理文件路径的问题,也就是右斜杠没有特殊意义。
import sys if len(sys.argv) < 3: print(‘Usage:python3 copy.py source.file target.file‘) sys.exit() with open(r‘%s‘ %sys.argv[1],‘rb‘) as f_read, open(r‘%s‘ %sys.argv[2],‘wb‘) as f_write: for line in f_read: f_write.write(line)
1.10 文件其他操作
1.10.1 read
例如:read(3)
1.文件打开方式为文本模式时,代表只读取3个字符。
f = open(‘a.txt‘,‘r‘,encoding=‘utf-8‘) print(f.read(3)) f.close()
2.文件打开方式为b模式时,代表读取3个字节。
f = open(‘a.txt‘,‘rb‘) print(f.read(6).decode(‘utf-8‘)) print(f.read(3).decode(‘utf-8‘)) f.close()
1.10.2 seak
以字节为单位,进行移动光标,有三种模式,三种模式默认指定的参照物不同;其中1、2模式必须在b模式下进行。
0模式:默认以文件开头为光标移动,参照物为文件开头
1模式:以当前光标所在的位置为参照物
2模式:以文件结尾为参照物,进行文件光标的移动
# seek的0模式 默认为0模式 f = open(‘a.txt‘,‘r‘) print(f.read(3)) print(f.tell()) f.seek(3) print(f.tell()) print(f.read()) # seek的1模式 f = open(‘a.txt‘,‘rb‘) print(f.read(3)) print(f.tell()) f.seek(3,1) print(f.tell()) print(f.read().decode(‘utf-8‘)) # seek的2模式 f=open(‘a.txt‘,‘rb‘) f.seek(0,2) print(f.tell()) print(f.read())
1.10.3 tell
tell是告诉光标的位置,tell编译器的具体实现:
def tell(self, *args, **kwargs): # real signature unknown """ Current file position. Can raise OSError for non seekable files. """ pass
1.10.4 truncate
truncate是截断文件,所以文件的打开方式必须可写,但是不能用w、w+等方式打开,因为那样直接清空文件,所以truncate要在r+、a、a+等模式使用;
with open(‘a.txt‘,‘r+‘,encoding=‘utf-8‘) as f: f.truncate(2)
1.10.5 类似于tail命令
以rb方式打开文件,光标移动到最后:f.seek(0,2)
# tail.py -f access.log import time import sys with open(r‘%s‘ % sys.argv[2], ‘rb‘) as f: f.seek(0, 2) while True: line = f.readline() if line: print(line.decode(‘utf-8‘),end=‘‘) else: time.sleep(0.5)
1.11 总结
最常用的模式:r、w、a
rb、wb、ab
文件的其他模式,了解即可
2.函数
2.1 不用函数的问题
复杂度增大
组织结构不清晰
可读性差
代码冗余
可扩展性差
如何解决问题:
利用函数进行解决问题。例如修改下水道的问题:需要准备工具;利用工具与函数进行类比:
1.工具就是具备某一种功能的物件,就是程序中的函数的概念
2.事先准备工具的过程称为函数的定义
3.遇到特定的场景拿来就用称为函数的调用
2.2 函数的分类
在python中,函数的分类有两种:
1. 内置函数
2. 自定义函数
例如:python内置的函数(len、print、max)
2.3 原则
函数的使用原则:
1.先定义
2.再调用
2.4 直观感受使用函数
‘‘‘ ********************** hello jack ********************** ‘‘‘ def print_star(): print(‘*‘*20) def print_msg(): print(‘hello jack‘) print_star() print_msg() print_star()
2.5 函数使用
函数的定义与变量的定义类似,没有事先定义变量,而直接引用变量,会报错
没有事先定义函数,而直接调用,就相当于在引用一个不存在的变量名
‘‘‘ 函数的使用: 1 先定义 2 再调用 ‘‘‘ #定义阶段 def foo(): print(‘from foo‘) bar() def bar(): print(‘from bar‘) #调用阶段 foo()
函数在定义阶段发生了什么事情??
函数在定义阶段:只检测语法,不执行代码
def func(): asdf #asdf=’bbbb’ func()
2.6 函数定义
#函数的定义语法 ‘‘‘ def 函数名(arg1,arg2,arg3): "注释" 函数体 return 返回值 函数名一般是动词 参数 return:函数内部可以有多个return,但只能执行一次,函数就结束调用, 并且会把return后的值作为函数执行的结果返回 ‘‘‘
2.6.1函数定义三种形式
无参: 应用场景仅仅只是执行一些操作,比如与用户交互,打印
有参: 需要根据外部传进来的参数,才能执行相应的逻辑,比如统计长度,求最大值
空函数:设计代码结构
2.6.2 无参函数
def foo(): print(‘from foo‘)
2.6.3 有参函数
# 求最大值的函数,类似于python内置函数max def my_max(x,y): if x > y: return x else: return y res=my_max(1,2) print(res)
2.6.4 空函数
# sql解析,首先设计sql解析框架 def select(sql): ‘‘‘select function‘‘‘ print(sql) #sql=[‘select‘, ‘*‘, ‘from‘, ‘mysql.user;‘] def insert(sql): ‘‘‘insert function‘‘‘ pass def update(sql): ‘‘‘update function‘‘‘ pass def delete(sql): ‘‘‘delete function‘‘‘ pass #select * from mysql.user; def main(): while True: sql=input(‘>>: ‘).strip() if not sql:continue cmd_info=sql.split() cmd=cmd_info[0] if cmd == ‘select‘: select(cmd_info) main()
2.7 函数return
return,是函数结束的标志
return的返回值没有类型限制
1. 没有return:返回None,等同于return None
2. return 一个值:返回该值
3. return val1,val2,val3:返回(val1,val2,val3)
需要返回值:
调用函数,经过一系列的操作,最后得到一个确定的结果,则必须要有返回值
通常有参函数要有返回值,输入参数,经过计算,得到一个最终结果
不需要返回值:
调用函数,仅仅只是执行一系列的操作,最后不需要得到结果,无序有返回值
通常无参函数不需要有返回值
#函数的返回值,返回多个值 def func(): print(‘from func‘) return [1,2,3],‘a‘,1,{‘a‘:3}
2.8 函数调用
函数的调用,有三种形式:
1.语句形式
2.表达式形式
3.函数调用当做另一个函数的参数
def my_max(x,y): if x > y: return x else: return y my_max(1,2) # 语句形式 res=my_max(1,2)*10 # 表达式形式 res2=my_max(my_max(1,2),3) # 函数调用可以当做另外一个函数的参数
2.9 函数参数
函数的参数,分两种
1.形参:在定义函数时,括号内的参数,形参就是变量名
2.实参:在调用函数时,括号内的参数,实参就是变量值
在调用阶段实参(变量值)才会绑定形参(变量名),调用结束,解除绑定
#形参:在定义函数时,括号内的参数成为形参 #特点:形参就是变量名 def foo(x,y): #x=1,y=2 print(x) print(y) #实参:在调用函数时,括号内的参数成为实参 #特点:实参就是变量值 foo(1,2) #在调用阶段实参(变量值)才会绑定形参(变量名) #调用结束后,解除绑定
2.10 参数分类
2.10.1 位置参数
位置参数:按照从左到右的顺序依次定义的参数
1.位置形参:必须被传值,并且多一个不行,少一个也不行
2.位置实参:与形参按照位置一一对应
def foo(x,y): print(x) print(y) foo(1,2) def register(name,age): print(name) print(age) register(‘jack‘,18)
2.10.2 关键字参数
关键字实参:指的是按照name=value的形式,指名道姓地给name传值
关键字参数需要注意的问题:
问题一:语法规定位置实参必须在关键字实参的前面
问题二:一定不要对同一个形参传多次值
def foo(name,age): print(name) print(age) foo(age=18,name=‘jack‘) #关键字实参需要注意的问题是: def foo(name,age,sex): print(name) print(age) print(sex) # 正常传值 foo(‘jack‘,18,‘male‘) foo(sex=‘male‘,age=18,name=‘jack‘) foo(‘jack‘,sex=‘male‘,age=18) #问题一:语法规定位置实参必须在关键字实参的前面 foo(‘jack‘,sex=‘male‘,age=18) #问题二:一定不要对同一个形参传多次值 foo(‘jack‘,sex=‘male‘,age=18,name=‘jack1‘) foo(‘male‘,age=18,name=‘jack1‘)
2.10.3 默认参数
默认参数,即默认形参:在定义阶段,就已经为形参赋值,意味在调用阶段可以不用传值
使用默认参数,可以降低函数使用的复杂度。
def foo(x,y=222): print(x) print(y) foo(‘jack‘) foo(1,‘a‘) def register(name,age,sex=‘male‘): print(name,age,sex) register(‘jack‘,73) register(‘tom‘,38) register(‘mary‘,28,‘female‘)
默认参数需要注意的问题
问题一:默认参数必须放在位置参数之后
def foo(y=1, x): print(x, y)
问题二:默认参数只在定义阶段赋值一次,而且仅一次
x=100 def foo(a,b=x): print(a,b) x=22222 foo(‘jack‘)
问题三:默认参数的值应该定义成不可变类型
不可变类型:包括字符串、数字、元组
可变类型: 列表、字典
2.11 可变长参数
可变长参数指的是实参的个数不固定(个数多了)
实参无非位置实参和关键字实参两种
形参必须要两种机制分别处理:
按照位置定义的实参溢出的情况 *
按照关键字定义的实参溢出的情况 **
2.11.1 位置参数
多出来的位置实参,会交给*处理,保存成元组的形式,*把多出来赋值给args
def foo(x,y,*args): #args=(3,4,5,6,7) print(x) print(y) print(args) foo(1,2,3,4,5,6,7) #* foo(1,2) #*
*args的扩展用法
* 处理的是位置参数
* 可以存在于形参位置,*也可以在于实参位置
碰到*位于实参位置,打回原形,拆成位置参数
例如:foo(1,2,*(3,4,5,6,7)) <====> foo(1,2,3,4,5,6,7)
def foo(x,y,*args): # *args = *(3,4,5,6,7) print(x) print(y) print(args) foo(1,2,3,4,5,6,7) # * foo(1,2,*(3,4,5,6,7)) # 等价于foo(1,2,3,4,5,6,7) def foo(x,y,*args): # print(x) print(y) print(args) foo(‘a‘,‘b‘,*(1,2,3,4,5,6,7)) # 等价于foo(‘a‘,‘b‘,1,2,3,4,5,6,7) foo(‘jack‘,10,2,3,4,5,6,9)
2.11.2 关键字参数
多出来的关键字实参,会交给**处理,保存成字典形式,**把多出来的参数交给kwargs
def foo(x,y,**kwargs): #kwargs={‘z‘:3,‘b‘:2,‘a‘:1} print(x) print(y) print(kwargs) foo(1,2,z=3,a=1,b=2) #**
**kwargs的扩展用法
** 处理的是关键字参数
** 可以存在于形参位置,**也可以在于实参位置
碰到**位于实参位置,打回原形,拆成关键字参数
例如:foo(1,2,**{‘z‘:3,‘b‘:2,‘a‘:1}) <====> foo(1,2,a=1,z=3,b=2)
def foo(x,y,**kwargs): # kwargs={‘z‘:3,‘b‘:2,‘a‘:1} print(x) print(y) print(kwargs) foo(1,2,**{‘z‘:3,‘b‘:2,‘a‘:1}) # foo(1,2,a=1,z=3,b=2) def foo(x, y): print(x) print(y) foo(**{‘y‘:1,‘x‘:2}) # foo(y=1,x=2)
2.11.3 混合使用
def foo(x,*args,**kwargs): # args=(2,3,4,5) kwargs={‘b‘:1,‘a‘:2} print(x) print(args) print(kwargs) foo(1,2,3,4,5,b=1,a=2)
2.11.4 间接调用函数
import time def register(name,age,sex=‘male‘): print(name) print(age) print(sex) time.sleep(3) def wrapper(*args, **kwargs): #args=(‘egon‘,) kwargs={‘age‘:18} start_time=time.time() register(*args, **kwargs) stop_time=time.time() print(‘run time is %s‘ %(stop_time-start_time)) wrapper(‘jack‘,age=26) register(‘jack‘,26)
2.11.5 命名关键字参数
命名关键字参数,必须是被以关键字实参的形式传值
在*后面定义的形参称为命名关键字参数,必须是被以关键字实参的形式传值;属于了解内容。
def foo(*args,x): print(x) print(args) foo(1,2,3,4,x=‘jack‘) def foo(name,age,*,sex,group): print(name,age,sex,group) foo(‘jack‘,18,group=‘group1‘,sex=‘male‘) def foo(name,age,*,sex=‘male‘,group): print(name,age,sex,group) foo(‘mary‘,18,group=‘group1‘)
2.12 函数对象
函数是第一类对象:指的是函数可以被当做数据传递
1 被赋值
def foo(): print(‘from foo‘) f=foo print(f) f()
2 可以当做参数传入
def wrapper(func): # print(func) func() wrapper(foo)
3 可以当做函数的返回
def wrapper(func): return func res=wrapper(foo) print(res)
4 可以当做容器类型的元素
cmd_dic={ ‘func‘:foo } print(cmd_dic) cmd_dic[‘func‘]()