Python学习第三天之字符串编码解码,集合,文件,函数

1数据类型——集合

  • 初始化

      list = [ 1, 2,3,4,5 ]

      set1 = set ( list )

  • 集合的逻辑关系

      

    求交集: set3 = set1.intersection(set2)  或者  set3 = set1 & set2

    求并集:set1.union(set2)  或者 set1 | set2

    求差集:set6 = set1.difference(set2)  或者  set6 = set1 - set2

        set5 = set2.difference(set1) 或者   set5 = set2 - set1

    求对称差集: set5 + set6 = set1.symmetric_difference(set2)   或者  set5+set6 = set1 ^ set2

    判断a是不是b的子集:a.issubset(b)   或者是判断b是不是a的父集, b.issuperset(a)

    判断ab是否有交集: a.isdisjoint(b)  无交集返回TRUE 有交集返回FALSE

  • 集合的方法

    长度:len(set)   ,  判断元素是否在set里:x in set , 浅复制:set.copy()

    增:set.add("aaaa")

      set.update( [1,2,3,4,5] )

    删:set.remove("aaa")  没有aaa报错  ,    set.discard("aaa")   没有aaa返回none

    很神奇 ,  没有改和查。。看来是不能直接在集合里改和查

2.文件操作

  • 文件操作的过程:打开文件获得句柄——>操作文件行(遍历等)——>关闭文件

  • 打开文件获得句柄

      比较low的方法: f = open("file_path","r","encoding=utf-8") 操作完后要关闭文件 f.close

      高大上的方法:用完自动关闭

             with  open("file_path", "r" , "encoding=utf-8") as f1,

                open("file_path", "r" , "encoding=utf-8") as f2 :

       打开方式参数说明:

            r : 只能读,一行一行的读

            w:只能写,按顺序写,这个参数会创建一个新文件。切记

            a:追加,打开一个文件然后,只能从最后面开始写

            r+:这个读就是跟r一样,写就是跟a一样。前提是你不移动光标

            w+:这个要创建空白文件或覆盖一个同名旧文件。不移动光标读不出任何数据,但是移动光标是闲的蛋疼才去干的事

            a+:追加读。无论怎样移动光标,只能追加,但是不移动光标读不出来数据,也是个蛋疼的设计

            rb:以二进制格式去读文件,读bytes类型的二进制,或者视频等文件,如果你想看010100101100可以这么干

            wb:二进制写,写010110011010进去,传输bytes应该用得到

            rU:\r\n变成\n打开,Windows写的可以拿到Linux里面运行了,不过,请问谁会用Windows的记事本去写脚本?除非他觉得自己时间没地方花。

  • 操作文件

      读一下光标移动一下, 写一下光标移动一下,想象一下往记事本里写东西的感觉

     操作光标:f.tell() 当前光标所在的字符位置(按字符个数)。  f.seek(0) 光标回到起点  , f.seek(10)  光标移到第10个字符。

          我感觉我不太会去使用它,复杂的情况下,天知道你的光标会移动到哪里去了。。

     读  : f.readline() 读一行,注意是光标所在位置的那一行,第一行光标移动一行

        f.readlines() 把整个文件所有字符读进一个列表中,这个。。有可能把内存花光

         f.read()  把整个文件所有字符读进一个字符串中,这个。。有可能把内存花光

        f.read(5)  读从光标开始的5个字符,不过谁会去用它呢?

     写 : f.write(“balabalabalabala”) 写字符串,按顺序写

遍历: 1.  高大上,速度快的方法:                      

count = 0                                

for  line   in  f:  f是文件句柄,迭代器                          

   print(line)

   count += 1

遍历2.  把内存撑爆的方法:自己搞着玩可以

for  index,line  in   enumerate(f.readlines()):

    print (index, line)

    其他的一些蛋疼的方法:

f.encoding 该文件的编码 f.fileno()该文件句柄编号,操作系统维护 f.isatty是不是终端设备文件
f.name  文件名字 f.seekable能不能移动指针 f.readable  可读?
f.writable  可写? f.closed 是否关闭 f.flush() 缓存满了刷新进硬盘,同步要求高可用
f.truncate()  干嘛用?需要查一下 f.truncate(10)  截断10个  a模式下  
  • 打印进度条

import  sys , time

for  i  in  range(20):

  sys.stdout.write(">")   标准输出.控制台

  sys.stdout.flush()

  time.sleep(0.1)

时间: 2024-10-11 08:57:32

Python学习第三天之字符串编码解码,集合,文件,函数的相关文章

Python学习第三天--数据类型

数据类型: int()  整型 float()浮点型 e记法   (有点像数学中的科学计数法) 知识点概括: 字符相加,结果为和 >>> 520 + 5201040 2.字符串相加,结果为"拼接" >>> '520'+'1314''5201314' 3.逻辑运算,python认为True=1,False=0,(True和False第一个字母必须为大写) >>> True + True 2 >>> True - Tr

python 学习笔记 三 字典

字典 Python的高效的key/value哈希表结构叫做"dict", dict的内容可以写成一系列的key:value对并放入{ }中, 相当于: dict = {key1:value1, key2:value2, ...}, 一个空的字典就是俩个大括号{ }. 下面是从一个空字典创建字典以及一些关键点: 数字, 字符串和元组可以作为字典的key, value可以是任何类型(包括字典). ## Can build up a dict by starting with the the

OpenCV for Python 学习笔记 三

给源图像增加边界 cv2.copyMakeBorder(src,top, bottom, left, right ,borderType,value) src:源图像 top,bottem,left,right: 分别表示四个方向上边界的长度 borderType: 边界的类型 有以下几种: BORDER_REFLICATE # 直接用边界的颜色填充, aaaaaa | abcdefg | gggg BORDER_REFLECT # 倒映,abcdefg | gfedcbamn | nmabcd

Python学习(三):入门篇:Python中怎么编写类

Python中怎么编写类 Last Edit 2013/5/2 先看一个例子: #person.py class person: """class to representaion a person""" def __init__(self,name,age): self.name=name if 0<age<=150: self.age=age else: print 'age is no valid!' def display(s

Python学习(三) 八大排序算法的实现(下)

本文Python实现了插入排序.基数排序.希尔排序.冒泡排序.高速排序.直接选择排序.堆排序.归并排序的后面四种. 上篇:Python学习(三) 八大排序算法的实现(上) 1.高速排序 描写叙述 通过一趟排序将要排序的数据切割成独立的两部分,当中一部分的全部数据都比另外一部分的全部数据都要小,然后再按此方法对这两部分数据分别进行高速排序,整个排序过程能够递归进行,以此达到整个数据变成有序序列. 1.先从数列中取出一个数作为基准数. 2.分区过程,将比这个数大的数全放到它的右边,小于或等于它的数全

python学习笔记三---segmaphore信号量学习

# *-* coding=gb2312 *-* ''' 信号量semaphore 是一个变量,控制着对公共资源或者临界区的访问.信号量维护着一个计数器,指定可同时访问资源或者进入临界区的线程数. 每次有一个线程获得信号量时,计数器-1.若计数器为0,其他线程就停止访问信号量,直到另一个线程释放信号量. ''' import threading import random import time class MyThread(threading.Thread): availableTables=[

Python学习(三)数据结构

Python 数据结构 本章介绍 Python 主要的 built-type,包括如下: Numeric types          int float Text Sequence Type       str Boolean              bool Sequence  Types        list tuple range Mapping Types          dict Set Types             set type() 函数 type(object)

[Python学习] 专题三.字符串的基础知识

        在Python中最重要的数据类型包括字符串.列表.元组和字典等.该篇主要讲述Python的字符串基础知识. 一.字符串基础         字符串指一有序的字符序列集合,用单引号.双引号.三重(单双均可)引号引起来.如: s1='www.csdn.net'   s2="www.csdn.net"   s3='''aaabbb''' 其中字符串又包括: 1.转义字符串 像C语言中定义了一些字母前加"\"来表示常见的那些不能显示的ASCII字符,pyth

python 学习(三)

按照上次python 学习(二)的思路,第一步要实现从一个网站的页面上自动获取指定列表中的信息.折腾数日,得到一段可以正常运行的代码,如下: 1 #web2.py 2 3 import re 4 import urllib.request 5 6 def get_msg_for_url(s): 7 8 if s =='': 9 print("not url!\n") 10 exit() 11 12 ah_whdeps_url = {"ahswht":"ht