一、Python简介
1.1 Python介绍
Python的创始人:Guido van Rossum
最新的TIOBE排行榜:http://www.tiobe.com/tiobe_index
1.2 Python应用
Python可以应用于众多领域,如:数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎所有大中型互联网企业都在使用Python,如:Youtube、Dropbox、BT、Quora(中国知乎)、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、腾讯、汽车之家、美团等。
目前Python主要应用领域:
1)、云计算: 云计算最火的语言, 典型应用OpenStack
2)、WEB开发: 众多优秀的WEB框架,众多大型网站均为Python开发,Youtube, Dropbox, 豆瓣。。。, 典型WEB框架有Django
3)、科学运算、人工智能: 典型库NumPy, SciPy, Matplotlib, Enthought librarys,pandas
4)、系统运维: 运维人员必备语言
5)、金融:量化交易,金融分析,在金融工程领域,Python不但在用,且用的最多,而且重要性逐年提高。原因:作为动态语言的Python,语言结构清晰简单,库丰富,成熟稳定,科学计算和统计分析都很牛逼,生产效率远远高于c,c++,java,尤其擅长策略回测
6)、图形GUI: PyQT, WxPython,TkInter
Python在一些公司的应用:
谷歌:Google App Engine 、code.google.com 、Google earth 、谷歌爬虫、Google广告等项目都在大量使用Python开发
CIA: 美国中情局网站就是用Python开发的
NASA: 美国航天局(NASA)大量使用Python进行数据分析和运算
YouTube:世界上最大的视频网站YouTube就是用Python开发的
Dropbox:美国最大的在线云存储网站,全部用Python实现,每天网站处理10亿个文件的上传和下载
Instagram:美国最大的图片分享社交网站,每天超过3千万张照片被分享,全部用python开发
Facebook:大量的基础库均通过Python实现的
Redhat: 世界上最流行的Linux发行版本中的yum包管理工具就是用python开发的
豆瓣: 公司几乎所有的业务均是通过Python开发的
知乎: 国内最大的问答社区,通过Python开发(国外Quora)
春雨医生:国内知名的在线医疗网站是用Python开发的
除上面之外,还有搜狐、金山、腾讯、盛大、网易、百度、阿里、淘宝 、土豆、新浪、果壳等公司都在使用Python完成各种各样的任务。
1.3 Python解释器
1)Cpython(官方)
当我们从Python官方网站下载并安装好Python 2.7后,我们就直接获得了一个官方版本的解释器:CPython。这个解释器是用C语言开发的,所以叫CPython。在命令行下运行python就是启动CPython解释器。CPython是使用最广的Python解释器。
2)IPython
IPython是基于CPython之上的一个交互式解释器,也就是说,IPython只是在交互方式上有所增强,但是执行Python代码的功能和CPython是完全一样的。好比很多国产浏览器虽然外观不同,但内核其实都是调用了IE。
CPython用>>>作为提示符,而IPython用In [序号]:作为提示符。
3)PyPy
PyPy是另一个Python解释器,它的目标是执行速度。PyPy采用JIT技术,对Python代码进行动态编译(注意不是解释),所以可以显著提高Python代码的执行速度。绝大部分Python代码都可以在PyPy下运行,但是PyPy和CPython有一些是不同的,这就导致相同的Python代码在两种解释器下执行可能会有不同的结果。如果你的代码要放到PyPy下执行,就需要了解PyPy和CPython的不同点。
4)Jython
Jython是运行在Java平台上的Python解释器,可以直接把Python代码编译成Java字节码执行。
5)IronPython
IronPython和Jython类似,只不过IronPython是运行在微软.Net平台上的Python解释器,可以直接把Python代码编译成.Net的字节码。
小结:
Python的解释器很多,但使用最广泛的还是CPython。如果要和Java或.Net平台交互,最好的办法不是用Jython或IronPython,而是通过网络调用来交互,确保各程序之间的独立性。
二、Python发展历史
1989年,为了打发圣诞节假期,Guido开始写Python语言的编译器。Python这个名字,来自Guido所挚爱的电视剧Monty Python’s Flying Circus。他希望这个新的叫做Python的语言,能符合他的理想:创造一种C和shell之间,功能全面,易学易用,可拓展的语言。
1991年,第一个Python编译器诞生。它是用C语言实现的,并能够调用C语言的库文件。从一出生,Python已经具有了:类,函数,异常处理,包含表和词典在内的核心数据类型,以及模块为基础的拓展系统。
Granddaddy of Python web frameworks, Zope 1 was released in 1999
Python 1.0 - January 1994 增加了 lambda, map, filter and reduce.
Python 2.0 - October 16, 2000,加入了内存回收机制,构成了现在Python语言框架的基础
Python 2.4 - November 30, 2004, 同年目前最流行的WEB框架Django 诞生
Python 2.5 - September 19, 2006
Python 2.6 - October 1, 2008
Python 2.7 - July 3, 2010
In November 2014, it was announced that Python 2.7 would be supported until 2020, and reaffirmed that there would be no 2.8 release as users were expected to move to Python 3.4+ as soon as possible
Python 3.0 - December 3, 2008
Python 3.1 - June 27, 2009
Python 3.2 - February 20, 2011
Python 3.3 - September 29, 2012
Python 3.4 - March 16, 2014
Python 3.5 - September 13, 2015
三、Python 2.X vs Python 3.X
3.1 概述
Python 2.7 是一个过渡版本
Python 3.x 是长期版本
3.2 详细差异
1)编码问题 Python3.x无需再特意指定UTF-8,默认支持UTF-8编码
2)print函数区别
C:\Users\Administrator>python Python 2.7.11 (v2.7.11:6d1b6a68f775, Dec 5 2015, 20:32:19) [MSC v.1500 32 bit ( Intel)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> print "Hello World" Hello World >>> C:\Users\Administrator>python3 Python 3.5.0 (v3.5.0:374f501f4567, Sep 13 2015, 02:16:59) [MSC v.1900 32 bit (In tel)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> print "Hello World" File "<stdin>", line 1 print "Hello World" ^ SyntaxError: Missing parentheses in call to ‘print‘ >>> print("Hello World") Hello World
3)某些库改名了
4)用户输入
Python 2.x:raw_input Python 3.x:input
5)1/2问题
C:\Users\Administrator>python Python 2.7.11 (v2.7.11:6d1b6a68f775, Dec 5 2015, 20:32:19) [MSC v.1500 32 bit ( Intel)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> 1/2 0 >>> C:\Users\Administrator>python3 Python 3.5.0 (v3.5.0:374f501f4567, Sep 13 2015, 02:16:59) [MSC v.1900 32 bit (In tel)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> 1/2 0.5
6)class定义
7)性能
Py3.0运行 pystone benchmark的速度比Py2.5慢30%。Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可
以取得很好的优化结果。
Py3.1性能比Py2.5慢15%,还有很大的提升空间。
8)range()
Python 2.x >>> range(10) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>> type(range(10)) <type ‘list‘> Python 3.x >>> range(10) range(0, 10) >>> type(range(10)) <class ‘range‘>
四、Python安装
4.1 安装介绍
详见:http://madsstudy.blog.51cto.com/6249249/1770483
4.2 使用建议
Window 下开发工具较多,优先在Windows环境开发
Linux环境适用于代码调试和简单的运维脚本编写
五、第一个Python程序
[email protected]:~/python$ cat hello.py #!/usr/bin/env python3 # 明确的指出hello.py脚本由python解释器来执行 #_*_coding:utf-8_*_ print("Hello World!") [email protected]-virtual-machine:~/python$ chmod +x hello.py # 执行前需给予hello.py执行权限 [email protected]:~/python$ ./hello.py Hello World!
Hello World
对比其他语言hello world
http://madsstudy.blog.51cto.com/6249249/1771215
Python内部执行过程(转)
六、变量
6.1 变量声明
#!/usr/bin/env python # encoding: utf-8 name = "zhangsan" 注:声明了一个变量,变量名为: name,变量name的值为:"zhangsan"
6.2 变量定义规则
1)变量名只能是 字母、数字或下划线的任意组合
2)变量名的第一个字符不能是数字,可以是下划线及字母
3)不能与Python关键字重复
[‘and‘, ‘as‘, ‘assert‘, ‘break‘, ‘class‘, ‘continue‘, ‘def‘, ‘del‘,
‘elif‘, ‘else‘, ‘except‘, ‘exec‘, ‘finally‘, ‘for‘, ‘from‘, ‘global‘,
‘if‘, ‘import‘, ‘in‘, ‘is‘, ‘lambda‘, ‘not‘, ‘or‘, ‘pass‘, ‘print‘,
‘raise‘, ‘return‘, ‘try‘, ‘while‘, ‘with‘, ‘yield‘]
6.3 变量赋值
name1 = "zhangsan"
name2 = name1
print(name1,name2)
print(id(name1),id(name2))
name1 = "lisi"
print(name1,name2)
print(id(name1),id(name2))
解释为何最后name1 与 name2的值不同?
1)给name1变量分配一个内存地址存放name的值zhangsan
2)把name2变量的值等于nam1e内存地址中存放的值zhangsan
3)将name1的变量值修改为lisi,是重新分配一个内存地址存放name1的新值,此时 name1=lisi 而name2不变等于zhangsan
七、字符编码
字符编码出现的时间:ASCII>Unicode>UTF-8
三种编码的特点
1)ASCII:(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号
2)Unicode:Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,
注:此处说的的是最少2个字节,可能更多
3)UTF-8:UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存...
Python解释器在加载.py文件中的代码时,会对内容进行编码(默认ASCII),如下报错:
[email protected]:~/python$ cat hello.py #!/usr/bin/env python print(‘你好‘) [email protected]-virtual-machine:~/python$ python hello.py File "hello2.py", line 3 SyntaxError: Non-ASCII character ‘\xe4‘ in file hello2.py on line 3, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
解决:
[email protected]:~/python$ cat hello.py #!/usr/bin/env python #_*_coding:utf-8_*_ print(u‘你好‘) [email protected]-virtual-machine:~/python$ python hello.py 你好 Python 3.X已经不存在这个问题 [email protected]-virtual-machine:~/python$ cat hello.py #!/usr/bin/env python3 print(‘你好‘) [email protected]-virtual-machine:~/python$ python3 hello.py 你好
八、注释
注释原则:源程序有效注释量应该在20%以上,注释的原则是有助于对程序的阅读理解,在该加的地方都加了,注释不宜太多也不能太少,注释语言必须准确、易懂、简洁。
开发规范1:每行不能超过80个字符
单行注释:# 我被注释掉了,仅到行尾为止
多行注释:‘‘‘ 在这个范围内的所有内容都经被注释‘‘‘
九、用户输入
9.1 常规使用
#!/usr/bin/env python3 # encoding: utf-8 name = input("Please input your name:") # Python 3.x name = raw_input("Please input your name:") # Python 2.x print(name)
9.2 隐藏输入内容实现
getpass模块(适用范围 linux可以, window不行; Python 3.x可以)
[email protected]:~/python$ cat test_getpass.py #!/usr/bin/python #-*-coding:utf-8-*- import getpass username = input("username:") password = getpass.getpass("password:") print (username,password) [email protected]-virtual-machine:~/python$ python3 test_getpass.py username:root password: root sss
十、模块
Python的强大之处在于他有非常丰富和强大的标准库和第三方库,几乎你想实现的任何功能都有相应的Python库支持
sys:
[email protected]:~/python$ cat input.py #!/usr/bin/env python #_*_coding:utf-8_*_ import sys if len(sys.argv)<2: print "\033[32;1m"+"Usages: Host Port"+"\033[0m" sys.exit(2) host = sys.argv[1] port = sys.argv[2] print "host:%s port:%s" % (host,port) [email protected]-virtual-machine:~/python$ python input.py 192.168.1.1 22 host:192.168.1.1 port:22
os:
>>> import os >>> os.mkdir(‘student‘) # 新建目录 >>> os.system(‘ls -l‘) # 查看当前目录内容总用量 20 -rwxrwxr-x 1 mads mads 83 5月 8 15:39 hello.py drwxrwxr-x 2 mads mads 4096 5月 8 18:02 __pycache__ drwxrwxr-x 2 mads mads 4096 5月 8 18:16 student -rwxrwxr-x 1 mads mads 151 5月 8 18:00 test_getpass.py -rwxrwxr-x 1 mads mads 73 5月 5 15:53 test.py0 >>> cmd_res = os.system(‘ls -l‘) # 仅保存命令执行的返回值总用量 20 -rwxrwxr-x 1 mads mads 83 5月 8 15:39 hello.py drwxrwxr-x 2 mads mads 4096 5月 8 18:02 __pycache__ drwxrwxr-x 2 mads mads 4096 5月 8 18:16 student -rwxrwxr-x 1 mads mads 151 5月 8 18:00 test_getpass.py -rwxrwxr-x 1 mads mads 73 5月 5 15:53 test.py >>> print cmd_res0 >>> cmd_res = os.popen(‘ls -l‘).read() # 保存命令的执行结果 >>> print cmd_res 总用量 20 -rwxrwxr-x 1 mads mads 83 5月 8 15:39 hello.py drwxrwxr-x 2 mads mads 4096 5月 8 18:02 __pycache__ drwxrwxr-x 2 mads mads 4096 5月 8 18:16 student -rwxrwxr-x 1 mads mads 151 5月 8 18:00 test_getpass.py -rwxrwxr-x 1 mads mads 73 5月 5 15:53 test.py
sys和os结合
import sys,os os.system(‘‘.join(sys.argv[1:]))
编写tab补全模块
vim中设置(待补充)
windows环境
# python startup file for window import sys import readline import rlcompleter import atexit import os # tab completion readline.parse_and_bind(‘tab: complete‘) del os,readline, rlcompleter
linux环境
#!/usr/bin/env python # python startup file import sys import readline import rlcompleter import atexit import os # tab completion readline.parse_and_bind(‘tab: complete‘) # history file histfile = os.path.join(os.environ[‘HOME‘], ‘.pythonhistory‘) try: readline.read_history_file(histfile) except IOError: pass atexit.register(readline.write_history_file, histfile) del os, histfile, readline, rlcompleter
for linux
mac环境
import sys import readline import rlcompleter if sys.platform == ‘darwin‘ and sys.version_info[0] == 2: readline.parse_and_bind("bind ^I rl_complete") else: readline.parse_and_bind("tab: complete") # linux and python3 on mac
for mac
注:保存内容为tab.py,使用import tab命令引用该模块。如果想在系统的何何一个地方都使用,要把这个tab.py放到python全局环境变量目录里。print(sys.path) 可以查看python环境变量列表,基本一般都放在一个叫 Python/2.7/site-packages 目录下,这个目录在不同的OS里放的位置不一样。
注意:环境列表的第一个‘ ‘表示当前目录,即环境查找的顺序问题
十一、Python语言
1)编译型和解释型
编译型:首先由编译器编译成机器能识别的机器码,才能开始执行
解释型:一般翻译一遍执行
2)动态类型语言和静态类型语言
动态类型语言:在运行期间才会做数据类型的检查的语言
静态类型语言:在编写程序的时候就要声明所有变量的数据类型
3)强类型定义语言和弱类型定义语言
强类型定义语言:变量一旦被赋值,必须经过强制转换才能被再次使用
弱类型定义语言:与强类型语言相反,一个变量可以附不用数据类型的值
结论:python是一门动态解释性的强类型定义语言
十二、数据类型
12.1 数据类型
1)整数
2)浮点型
3)字符串 转义字符
转义字符\可以转义很多字符,比如\n表示换行,\t表示制表符,字符\本身也要转义,所以\\表示的字符就是\
4)布尔类型
False True
可以进行and,or和not运算
5)空值
12.2 字符串格式化
Python采用的格式化方式和C语言类似
%运算符就是用来格式化字符串的。在字符串内部,%s表示用字符串替换,%d表示用整数替换,有几个%?占位符,后面就跟几个变量或者值,顺序要对应好。如果只有一个%?,括号可以省略。
%s永远起作用,它会把任何数据类型转换为字符串
对于Unicode字符串,用法完全一样,但最好确保替换的字符串也是Unicode字符串
有些时候,字符串里面的%是一个普通字符怎么办?这个时候就需要转义,用%%来表示一个%:
py3 的字符串格式化 提倡使用 format 函数
案例:
方法1:
name = raw_input("Please input your name:") age = int(raw_input("Please input your age:")) provice = raw_input("Please input your provice:") company = raw_input("Please input your company:") msg = ‘‘‘ Infomation of user %s ------------------------- name : %s age : %2f provice : %s company : %s -----------End----------- ‘‘‘ % (name,name,age,provice,company) print msg
方法2:字符拼接
name = input("Please input your name:") age = int(input("Please input your age:")) provice = input("Please input your provice:") company = input("Please input your company:") print("Infomation of:" + name + "\nname:" + name + "\nage:" + str(age) + "\npprovice:" + provice + "\ncompany:" + company)
十三、数据运算
详见:http://www.runoob.com/python/python-operators.html
十四、表达式(待补充)
十五、练习题
十六、图书
Python源码剖析