python初步——基础总结(一)

一.  第一个HelloWorld

1. 在linux 执行 (python2.7)

[[email protected] ~]# vim test.py
#!/usr/bin/env python    #---->python解释器
# -*- coding: utf-8 -*-  # ---> 字符集

print ‘Hello World‘

执行结果

# python test.py 
Hello World

2. 在windows pycharm 上执行

print(‘Hello World‘)

执行结果

Hello World

二. 变量

1. 声明变量

name = ‘Sam‘

print(name)

name 为变量名,‘Sam‘ 为变量名的值

2. 变量名命名规则

  • 变量名只能是 字母、数字或下划线的任意组合
  • 变量名的第一个字符不能是数字
  • 以下关键字不能声明为变量名
  • [‘and‘, ‘as‘, ‘assert‘, ‘break‘, ‘class‘, ‘continue‘, ‘def‘, ‘del‘, ‘elif‘, ‘else‘, ‘except‘, ‘exec‘, ‘finally‘, ‘for‘, ‘from‘, ‘global‘, ‘if‘, ‘import‘, ‘in‘, ‘is‘, ‘lambda‘, ‘not‘, ‘or‘, ‘pass‘, ‘print‘, ‘raise‘, ‘return‘, ‘try‘, ‘while‘, ‘with‘, ‘yield‘]

三. 字符集编码

python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)

1. ascill

ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号

2. 中文

big5  处理繁体中文

GB2312  1980年一共收录了7445个字符,包括6763个汉字和682个其它符号。

GBK   1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符

GB18030  2000年的 GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

GB2312 GBK GB18030 占两个字节,并且能够向下兼容    GB18030 --> GBK --> GB2312 --> ASCILL

3. unicode

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536

4. UTF-8

UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存

案例

ascill 无法识别中文,会报错

[[email protected] ~]#!/usr/bin/env python

print ‘你好世界‘

告诉解释器,用支持中文的编码执行

[[email protected] ~]#!/usr/bin/env python
# -*- coding: utf-8 -*-
print ‘你好世界‘

四. 注释

单行注释:# 代码是内容

快捷键: Ctrl + /

多行注释:‘‘‘内容‘‘‘  或者 """内容"""

五. 用户输入

[[email protected] ~]# cat test.py 
#!/usr/bin/env python
# -*- coding: gbk -*-

#name = raw_input(‘pls input your name:‘)    # python 2.X
name = input(‘pls input your name:‘)    # python 3.X
print name
[[email protected] ~]# python test.py 
pls input your name:高哨兵
高哨兵

注: input (2.X)==eval(input) (3.X)

raw_input  2.X == input  3.X

输入密码时,如果想要不可见,需要利用getpass 模块中的 getpass方法

[[email protected] ~]# cat test.py 
#!/usr/bin/env python
# -*- coding: gbk -*-
import getpass
password = getpass.getpass(‘pls input your password:‘)
print password
[[email protected] ~]# python test.py 
pls input your password:
123456

六. 模块

1. sys

1.1 sys.argv

[[email protected] ~]# cat test.py 
#!/usr/bin/env python
# -*- coding: gbk -*-
import sys
print sys.argv  # 参数列表
print sys.argv[0]
print sys.argv[1]
[[email protected] ~]# python test.py aa bb
[‘test.py‘, ‘aa‘, ‘bb‘]
test.py
aa

1.2 sys.path

[[email protected] ~]# cat test.py 
#!/usr/bin/env python
# -*- coding: gbk -*-
import sys
print sys.path    #打印环境变量
[[email protected] ~]# python test.py 
[‘/root‘, ‘/usr/lib64/python27.zip‘, ‘/usr/lib64/python2.7‘, ‘/usr/lib64/python2.7/plat-linux2‘, ‘/usr/lib64/python2.7/lib-tk‘, ‘/usr/lib64/python2.7/lib-old‘, ‘/usr/lib64/python2.7/lib-dynload‘, ‘/usr/lib64/python2.7/site-packages‘, ‘/usr/lib/python2.7/site-packages‘]

2. OS

2.1 os.system

[[email protected] ~]# cat test.py 
#!/usr/bin/env python
# -*- coding: gbk -*-
import os
result = os.system(‘ifconfig eth0‘)
print result
[[email protected] ~]# python test.py 
# os.system(‘ifconfig eth0‘)
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.130.128  netmask 255.255.255.0  broadcast 192.168.130.255
        inet6 fe80::20c:29ff:fec1:295a  prefixlen 64  scopeid 0x20<link>
        ether 00:0c:29:c1:29:5a  txqueuelen 1000  (Ethernet)
        RX packets 180648  bytes 20405707 (19.4 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 29076  bytes 2468508 (2.3 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
# print result  
0

2.2 os.popen

#!/usr/bin/env python
# -*- coding: gbk -*-
import os
result = os.popen(‘ifconfig eth0‘).read()
print result
[[email protected] ~]# python test.py 
# print result
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.130.128  netmask 255.255.255.0  broadcast 192.168.130.255
        inet6 fe80::20c:29ff:fec1:295a  prefixlen 64  scopeid 0x20<link>
        ether 00:0c:29:c1:29:5a  txqueuelen 1000  (Ethernet)
        RX packets 181087  bytes 20441778 (19.4 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 29291  bytes 2531300 (2.4 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0


3. 把参数当作命令执行

[[email protected] ~]# cat test.py 
#!/usr/bin/env python
# -*- coding: gbk -*-
import os,sys
os.system(‘ ‘.join(sys.argv[1:]))
[[email protected] ~]# python test.py ifconfig eth0
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.130.128  netmask 255.255.255.0  broadcast 192.168.130.255
        inet6 fe80::20c:29ff:fec1:295a  prefixlen 64  scopeid 0x20<link>
        ether 00:0c:29:c1:29:5a  txqueuelen 1000  (Ethernet)
        RX packets 181757  bytes 20497644 (19.5 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 29679  bytes 2669636 (2.5 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

4. 自己的模块

[[email protected] ~]# cat test.py
#!/usr/bin/env python
print ‘Hello World!‘
[[email protected] ~]# cat test2.py 
#!/usr/bin/env python
import test
[[email protected] ~]# python test2.py
Hello World!

注:test.py 必须放在环境变量的目录里,可使用print sys.path 查询,一般放在当前目录或者放在E:\Python36\Lib\site-packages 目录下

七.  认识.pyc

1. Python是一门解释型语言?

我初学Python时,听到的关于Python的第一句话就是,Python是一门解释性语言,我就这样一直相信下去,直到发现了*.pyc文件的存在。如果是解释型语言,那么生成的*.pyc文件是什么呢?c应该是compiled的缩写才对啊!

为了防止其他学习Python的人也被这句话误解,那么我们就在文中来澄清下这个问题,并且把一些基础概念给理清。

2. 解释型语言和编译型语言 

计算机是不能够识别高级语言的,所以当我们运行一个高级语言程序的时候,就需要一个“翻译机”来从事把高级语言转变成计算机能读懂的机器语言的过程。这个过程分成两类,第一种是编译,第二种是解释。

编译型语言在程序执行之前,先会通过编译器对程序执行一个编译的过程,把程序转变成机器语言。运行时就不需要翻译,而直接执行就可以了。最典型的例子就是C语言。

解释型语言就没有这个编译的过程,而是在程序运行的时候,通过解释器对程序逐行作出解释,然后直接运行,最典型的例子是Ruby。

通过以上的例子,我们可以来总结一下解释型语言和编译型语言的优缺点,因为编译型语言在程序运行之前就已经对程序做出了“翻译”,所以在运行时就少掉了“翻译”的过程,所以效率比较高。但是我们也不能一概而论,一些解释型语言也可以通过解释器的优化来在对程序做出翻译时对整个程序做出优化,从而在效率上超过编译型语言。

此外,随着Java等基于虚拟机的语言的兴起,我们又不能把语言纯粹地分成解释型和编译型这两种。

用Java来举例,Java首先是通过编译器编译成字节码文件,然后在运行时通过解释器给解释成机器文件。所以我们说Java是一种先编译后解释的语言。

3. Python到底是什么 

其实Python和Java/C#一样,也是一门基于虚拟机的语言,我们先来从表面上简单地了解一下Python程序的运行过程吧。

当我们在命令行中输入python hello.py时,其实是激活了Python的“解释器”,告诉“解释器”:你要开始工作了。可是在“解释”之前,其实执行的第一项工作和Java一样,是编译。

熟悉Java的同学可以想一下我们在命令行中如何执行一个Java的程序:

javac hello.java

java hello

只是我们在用Eclipse之类的IDE时,将这两部给融合成了一部而已。其实Python也一样,当我们执行python hello.py时,他也一样执行了这么一个过程,所以我们应该这样来描述Python,Python是一门先编译后解释的语言。

4. 简述Python的运行过程

在说这个问题之前,我们先来说两个概念,PyCodeObject和pyc文件。

我们在硬盘上看到的pyc自然不必多说,而其实PyCodeObject则是Python编译器真正编译成的结果。我们先简单知道就可以了,继续向下看。

当python程序运行时,编译的结果则是保存在位于内存中的PyCodeObject中,当Python程序运行结束时,Python解释器则将PyCodeObject写回到pyc文件中。

当python程序第二次运行时,首先程序会在硬盘中寻找pyc文件,如果找到,则直接载入,否则就重复上面的过程。

所以我们应该这样来定位PyCodeObject和pyc文件,我们说pyc文件其实是PyCodeObject的一种持久化保存方式。

八.  数据类型

1、数字

int(整型)

  在32位机器上,整数的位数为32位,取值范围为-2**31~2**31-1,即-2147483648~2147483647

  在64位系统上,整数的位数为64位,取值范围为-2**63~2**63-1,即-9223372036854775808~9223372036854775807

long(长整型)

  跟C语言不同,Python的长整数没有指定位宽,即:Python没有限制长整数数值的大小,但实际上由于机器内存有限,我们使用的长整数数值不可能无限大。

  注意,自从Python2.2起,如果整数发生溢出,Python会自动将整数数据转换为长整数,所以如今在长整数数据后面不加字母L也不会导致严重后果了。pyhton 3X没有长整型

float(浮点型)

先扫盲 http://www.cnblogs.com/alex3714/articles/5895848.html

  浮点数用来处理实数,即带有小数的数字。类似于C语言中的double类型,占8个字节(64位),其中52位表示底,11位表示指数,剩下的一位表示符号。

complex(复数)

  复数由实数部分和虚数部分组成,一般形式为x+yj,其中的x是复数的实数部分,y是复数的虚数部分,这里的x和y都是实数。

注:Python中存在小数字池:-5 ~ 257

2、布尔值

  真或假

  1 或 0

3、字符串

3.1 字符串格式化输出

>>> "I am %s, %d year old, I love %s" % (‘Sam‘,12, ‘dog‘)
‘I am Sam, 12 year old, I love dog‘
>>> "I am {}, {} year old, I love {}".format(‘Sam‘,12, ‘dog‘)
‘I am Sam, 12 year old, I love dog‘
>>> "I am {2}, {0} year old, I love {1}".format(12,‘dog‘, ‘Sam‘)
‘I am Sam, 12 year old, I love dog‘
>>> "I am {name}, {age} year old, I love {dong}".format(name=‘Sam‘,age=12, dong=‘dog‘)
‘I am Sam, 12 year old, I love dog‘

注:%s字符串,%d整型,%f浮点数

3.2 字符串方法

1--> 移除空白

str = ‘  ggggggggggg    \n‘
print(str)
print(str.strip())
print(str.lstrip())
print(str.rstrip())
print(‘````````````‘)


结果

  ggggggggggg    
  
ggggggggggg
ggggggggggg  
  
  ggggggggggg
````````````

2--> 分割

print(‘i am a boy, are you ok?‘.split(‘a‘))

结果

[‘i ‘, ‘m ‘, ‘ boy, ‘, ‘re you ok?‘]

3--> 长度

str = ‘i am a boy, are you ok?‘
print(len(str))

结果

23

4--> 索引

>>> ‘i am a boy, are you ok?‘.index(‘you‘)
16
>>> ‘i am a boy, are you ok?‘.index(‘a‘)
2

5--> 切片

>>> str=‘i am a boy, are you ok?‘
>>> str[5]
‘a‘
>>> str[5:]
‘a boy, are you ok?‘
>>> str[-3:]
‘ok?‘
>>> str[-3:-6]
‘‘
>>> str[-3:-6:-1]
‘o u‘
>>> str[-3:-8:-1]
‘o uoy‘

6 --> 替代

>>> str.replace(‘a‘,‘B‘)
‘i Bm B boy, Bre you ok?‘

注:还有很多方法,暂不一一总结

4. 列表

4.1 创建列表

>>> name = [‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘]
>>> type(name)
<type ‘list‘>
>>> name=list([‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘])
>>> type(name)
<type ‘list‘>
>>> name = []
>>> type(name)
<type ‘list‘>
>>> name = list()
>>> type(name)
<type ‘list‘>

4.2 列表方法(大部分方法与字符串一样)

1--> 索引

>>> name=list([‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘])
>>> name.index(‘jey‘)
3

2 --> 切片 (与字符串一样)

3--> 追加

>>> name.append(‘hao‘)
>>> name
[‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘, ‘hao‘]

4--> 删除

>>> name
[‘gao‘, ‘sam‘, ‘snow‘, ‘jey‘, ‘hao‘]
>>> del name[1]
>>> name
[‘gao‘, ‘snow‘, ‘jey‘, ‘hao‘]
>>> name
[‘gao‘, ‘snow‘, ‘jey‘, ‘hao‘]
>>> name.remove(‘gao‘)
>>> name
[‘snow‘, ‘jey‘, ‘hao‘]

5 --> 长度

>>> name
[‘snow‘, ‘jey‘, ‘hao‘]
>>> len(name)
3


6 --> 循环

>>> for i in name:
...   print i
... 
snow
jey
hao

注:还有很多方法,暂不一一总结


5. 元组(不可变列表)

>>> name=(‘Sam‘, ‘Jey‘, ‘Snow‘)
>>> type(name)
<type ‘tuple‘>
>>> name=tuple((‘Sam‘, ‘Jey‘, ‘Snow‘))
>>> type(name)
<type ‘tuple‘>

6. 字典(无序的)

>>> person = {‘name‘: ‘Sam‘, ‘age‘: 23}
>>> type(person)
<type ‘dict‘>
>>> person = dict({‘name‘: ‘Sam‘, ‘age‘: 23})
>>> type(person)
<type ‘dict‘>


九. 数据运算

算数运算:

比较运算:

赋值运算:

逻辑运算:

成员运算:

身份运算:

位运算:

运算符优先级:

十.  if   if...else  if...elif..else

1. if .. else

username = input(‘pls enter your username:‘)
password = input(‘pls enter your password:‘)
if username == ‘sam‘ and password == ‘123456‘:
    print(‘now login......‘)
else:
    print(‘invalid username or passwod‘)

2. if ... elif ..else

number = int(input(‘pls enter your number:‘))
if number == 50:
    print(‘you are right...‘)
elif number > 50:
    print(‘too big‘)
else:
    print(‘too small....‘)

十一. while

1. while True

while True:
    number = int(input(‘pls enter your number:‘))
    if number == 50:
        print(‘you are right...‘)
        break
    elif number > 50:
        print(‘too big‘)
    else:
        print(‘too small....‘)

2. while <表达式>

count = 1
while count > 3:
    number = int(input(‘pls enter your number:‘))
    if number == 50:
        print(‘you are right...‘)
    elif number > 50:
        print(‘too big‘)
    else:
        print(‘too small....‘)
    count += 1

十二. for

for i in range(2,12):
    print(‘number:‘, i)

结果

number: 2
number: 3
number: 4
number: 5
number: 6
number: 7
number: 8
number: 9
number: 10
number: 11

十二. bytes类型

以下内容取自http://www.cnblogs.com/zanjiahaoge666/p/6402907.html

标题:Python3中内置类型bytes和str用法及byte和string之间各种编码转换

python3最重要的新特性大概要算对文本和二进制数据做了更为清晰的区分,文本总是unicode字符集,有str类型表示,二进制数据则有bytes类型表示。python3不会以任何隐式的方式混用str和bytes,正是这是的这两者的区别特别明显,你不能拼接字符串和字节包,也无法在字节包里搜索字符串(反之亦然),也不能将字符串传入参数为字节包的函数(反之亦然);

我们不关心字符串在内部是如何被表示的,也不关心它用几个字节来表示每个字符。只有在将字符串编码成字节(如用于通信信道的传输)或将字节解码成字符串时,才考虑这些问题。

1. 创建bytes类型数据

>>> a = bytes([1,2,3,4])
>>> a
b‘\x01\x02\x03\x04‘
>>> type(a)
<class ‘bytes‘>
>>>
>>> a = bytes(‘hello‘,‘ascii‘)
>>>
>>> a
b‘hello‘
>>> type(a)
<class ‘bytes‘>

2. 编码可以将抽象字符以二进制数据的形式表示,有很多编码方法,如utf-8、gbk等,可以使用encode()函数对字符串进行编码,转换成二进制字节数据,也可用decode()函数将字节解码成字符串;用decode()函数解码,可不要用指定编码格式;

>>> a = ‘hello world‘
>>> type(a)
<class ‘str‘>
>>> a
‘hello world‘

a. 按utf-8的方式编码,转成bytes:以及解码成字符串

>>> b = a.encode(encoding=‘utf-8‘)
>>> type(b)
<class ‘bytes‘>
>>>
>>> b
b‘hello world‘
>>>
>>>
>>> c = b.decode(encoding=‘utf-8‘)
>>> type(c)
<class ‘str‘>
>>> c
‘hello world‘
>>>

b. 按gbk的方式编码,转成bytes:以及解码成字符串

>>> x = a.encode(encoding=‘gbk‘)
>>> type(x)
<class ‘bytes‘>
>>>
>>> x
b‘hello world‘
>>>
>>> y = x.decode()
>>> type(y)
<class ‘str‘>
>>>
>>> y
‘hello world‘
>>>

十三. 三元运算

>>> grilF = ‘Snow‘ if 2 > 1 else ‘Jey‘
>>> grilF
‘Snow‘
>>> grilF = ‘Snow‘ if 2 < 1 else ‘Jey‘
>>> grilF
‘Jey‘







时间: 2024-08-08 19:52:43

python初步——基础总结(一)的相关文章

老少皆宜的密大Python零基础入门

Who are we? MTech是一个由密歇根大学 工程院中 (AE/ME)的中国学生组成的的一个专注于专业知识和技能的分享和交流的俱乐部.我们创建这个俱乐部旨在促进工程专业中国学生之间技术层面的交流,搭建桥梁促进知识的分享和传播.请关注我们的微信公众号("密大MTech")和我们的网站(mtechmae.webstarts.com)了解关于我们的更多信息. What is Python? Python是一种面向对象.直译式的编程语言.它的语法简单,并包含了功能完备的库,适合解决很多

问道python之基础篇【二】python入门

问道python之基础篇[二] Python入门 1.python的工作过程 python解释器把源代码转换为字节码的中间形式,然后再把它翻译成机器使用的机器语言并运行. 2.pyc文件 2.1.什么是pyc文件 执行python代码时,如果导入了其他的.py文件,那么在执行过程中会自动生成一个与其同名的.pyc文件,该文件就是python解释器编译之后产生的字节码. ps:代码经过编译可以产生字节码:字节码通过反编译也可以得到代码. Pyc文件一般由3个部分组成: 最开始4个字节是一个Maig

【美妙的Python之二】Python初步

美妙的Python之Python起步 简而言之: Python 是能你无限惊喜的语言,与众不同.           1.动态类型:         Python是一种动态类型语言,不需要预先声明变量的类型,变量的类型和值在赋值那一刻动态地初始化.这一点与C/C++,Java等静态类型语言完全不同,静态类型在编译阶段就必须显示的声明变量的类型,动态类似在运行时才确定变量的类型.        变量a动态地初始化为int类型,并赋值2014;        变量msg则动态初始化为str类型,并赋

python/HTML基础

---恢复内容开始--- python/HTML基础 HTML: 超文本标记(标签)语言 (以<>扩起来的都是标签语言,放入标签里的不仅仅是文本)一套语言规则 浏览器的渲染顺序是从上到下,从左到右 不同的浏览器,对同一标签可能会有不完全相同的解释(兼容性)至今已经解决的差不多了 .html或htm   静态网页文件扩展名后缀 标签可以进行嵌套,但是不能进行交叉嵌套 HTML 不是一种编程语言,而是一种标记语言,HTML使用标记标签来描述网页 HTML结构: <html></h

Python服务器开发二:Python网络基础

Python服务器开发二:Python网络基础 网络由下往上分为物理层.数据链路层.网络层.传输层.会话层.表示层和应用层. HTTP是高层协议,而TCP/IP是个协议集,包过许多的子协议.包括:传输层的 FTP,UDP,TCP协议等,网络层的ip协议等,高层协议如HTTP,telnet协议等,HTTP是TCP/IP的一个子协议. socket是对TCP/IP协议的封装和应用(程序员层面上).也可以说,TPC/IP协议是传输层协议,主要解决数据如何在网络中传输,而HTTP是应用层协议,主要解决如

问道python之基础篇【一】 认识python

问道python之基础篇[一] 认识python 1.python的简介 1.1.什么是python? Python是一种面向对象.解释型计算机程序设计语言,由Guido van Rossum于1989年发明,第一个公开发行版发行于1991年. Python语法简洁清晰,特色之一是强制用空白符作为语句缩进. Python具有丰富和强大的库.它常被昵称为胶水语言,能够用其他语言制作的各种模块(尤其是C++)很轻松地联结在一起. 1.2.python的特点 简单,易学,免费.开源,高层语言,移植性,

Python学习基础篇第一篇——快速入门(适合初学者)

一.Python学习基础篇第一篇--(快速入门) 建议从Python2.7开始学习,Python2.7可以支持扩展大量的第三方类库,是目前比较成熟的版本 编写代码的软件推荐将python自带的IDLE和PyCharm集成IDE结合起来使用 1.1 Python命令行 Python命令行将以 >>> 开始,比如 >>>print 'Hello World!' 对于验证简单的命令可以在python自带的IDLE中完成  1.2 在Python自带的IDLE写一段小程序 在所

python 网络基础

服务器客户端模式,服务器存在唯一目的是:等待客户的请求, 一.套接字 unix套接字,AF_LOCAL,地址家族,缩写:AF,AF_LOCAL将代替AF_UNIX,很多时候两者等价 基于网络的套接字,AF_INET,AF_INET6 AF_NETLINK,无连接 python只支持AF_UNIX,AF_NETLINK,AF_INET家族 一种面向连接的:tcp协议,SOCK_STREAM 一种面向无连接的:udp协议,SOCK_DGRAM socket创建套接字,语法如下: socket(soc

Python爬虫基础之requests

一.随时随地爬取一个网页下来 怎么爬取网页?对网站开发了解的都知道,浏览器访问Url向服务器发送请求,服务器响应浏览器请求并返回一堆HTML信息,其中包括html标签,css样式,js脚本等.我们之前用的是Python标准基础库Urllib实现的, 现在我们使用Python的Requests HTTP库写个脚本开始爬取网页.Requests的口号很响亮“让HTTP服务人类“,够霸气. 二.Python Requests库的基本使用 1.GET和POST请求方式 GET请求 1 import re