(转载-学习)python wsgi 简介

基础知识

Python 知识

  • iterator 和 generator
  • 函数的高级用法:嵌套函数,作为参数传递等等
  • 了解 decorator 会对理解 wsgi 有很大的帮助
  • python 的 callable 概念
  • classmethod 和 staticmethod 的概念
  • web 编程的基础

HTTP 基础

对于 web 应用程序来说,最基本的概念就是客户端发送请求(request),收到服务器端的响应(response)。

下面是简单的 HTTP 请求:

 GET /Index.html HTTP/1.1\r\n
 Connection: Keep-Alive\r\n
 Accept: */*\r\n
 User-Agent: Sample Application\r\n
 Host: www.microsoft.com\r\n\r\n

内容包括了 method、 url、 protocol version 以及头部的信息。而 HTTP 响应(不包括数据)可能是如下的内容:

 HTTP/1.1 200 OK
 Server: Microsoft-IIS/5.0\r\n
 Content-Location: http://www.microsoft.com/default.htm\r\n
 Date: Tue, 25 Jun 2002 19:33:18 GMT\r\n
 Content-Type: text/html\r\n
 Accept-Ranges: bytes\r\n
 Last-Modified: Mon, 24 Jun 2002 20:27:23 GMT\r\n
 Content-Length: 26812\r\n

实际生产中,python 程序是放在服务器的 http server(比如 apache, nginx 等)上的。现在的问题是 服务器程序怎么把接受到的请求传递给 python 呢,怎么在网络的数据流和 python 的结构体之间转换呢?这就是 wsgi 做的事情:一套关于程序端和服务器端的规范,或者说统一的接口。

WSGI

我们先看一下面向 http 的 python 程序需要关心哪些内容:

  • 请求

    • 请求的方法 method
    • 请求的地址 url
    • 请求的内容
    • 请求的头部 header
    • 请求的环境信息
  • 响应
    • 状态码 status_code
    • 响应的数据
    • 响应的头部

WSGI(Web Server Gateway Interface) 的任务就是把上面的数据在 http server 和 python 程序之间简单友好地传递。它是一个标准,被定义在PEP 333。需要 http server 和 python 程序都要遵守一定的规范,实现这个标准的约定内容,才能正常工作。

应用程序端

WSGI 规定每个 python 程序(Application)必须是一个可调用的对象(实现了__call__函数的方法或者类),接受两个参数 environ(WSGI 的环境信息) 和start_response(开始响应请求的函数),并且返回 iterable。几点说明:

  1. environ 和 start_response 由 http server 提供并实现
  2. environ 变量是包含了环境信息的字典
  3. Application 内部在返回前调用 start_response
  4. start_response也是一个 callable,接受两个必须的参数,status(HTTP状态)和response_headers(响应消息的头)
  5. 可调用对象要返回一个值,这个值是可迭代的。

说了这么多的概念,再来看看代码的实现:

 # 1. 可调用对象是一个函数
def application(environ, start_response):

   response_body = ‘The request method was %s‘ % environ[‘REQUEST_METHOD‘]

   # HTTP response code and message
   status = ‘200 OK‘

   # 应答的头部是一个列表,每对键值都必须是一个 tuple。
   response_headers = [(‘Content-Type‘, ‘text/plain‘),
                       (‘Content-Length‘, str(len(response_body)))]

   # 调用服务器程序提供的 start_response,填入两个参数
   start_response(status, response_headers)

   # 返回必须是 iterable
   return [response_body]	

# 2. 可调用对象是一个类
class AppClass:
	"""这里的可调用对象就是 AppClass 这个类,调用它就能生成可以迭代的结果。
		使用方法类似于:
		for result in AppClass(env, start_response):
		     do_somthing(result)
	"""

    def __init__(self, environ, start_response):
        self.environ = environ
        self.start = start_response

    def __iter__(self):
        status = ‘200 OK‘
        response_headers = [(‘Content-type‘, ‘text/plain‘)]
        self.start(status, response_headers)
        yield "Hello world!\n"

# 3. 可调用对象是一个实例
class AppClass:
	"""这里的可调用对象就是 AppClass 的实例,使用方法类似于:
		app = AppClass()
		for result in app(environ, start_response):
		     do_somthing(result)
	"""

    def __init__(self):
        pass

    def __call__(self, environ, start_response):
        status = ‘200 OK‘
        response_headers = [(‘Content-type‘, ‘text/plain‘)]
        self.start(status, response_headers)
        yield "Hello world!\n"

服务器程序端

上面已经说过,标准要能够确切地实行,必须要求程序端和服务器端共同遵守。上面提到, envrion 和 start_response 都是服务器端提供的。下面就看看,服务器端要履行的义务。

  • 准备 environ 参数
  • 定义 start_response 函数
  • 调用程序端的可调用对象

PEP 333 里给出了一个 wsgi server 的简单实现,我又简化了一下——去除一些异常处理和判断,添加了一点注释:

import os, sys

def run_with_cgi(application):    # application 是程序端的可调用对象
	# 准备 environ 参数,这是一个字典,里面的内容是一次 HTTP 请求的环境变量
    environ = dict(os.environ.items())
    environ[‘wsgi.input‘]        = sys.stdin
    environ[‘wsgi.errors‘]       = sys.stderr
    environ[‘wsgi.version‘]      = (1, 0)
    environ[‘wsgi.multithread‘]  = False
    environ[‘wsgi.multiprocess‘] = True
    environ[‘wsgi.run_once‘]     = True
    environ[‘wsgi.url_scheme‘] = ‘http‘

    headers_set = []
    headers_sent = []

	# 把应答的结果输出到终端
    def write(data):
        sys.stdout.write(data)
        sys.stdout.flush()

	# 实现 start_response 函数,根据程序端传过来的 status 和 response_headers 参数,
	# 设置状态和头部
    def start_response(status, response_headers, exc_info=None):
        headers_set[:] = [status, response_headers]
      	return write

	# 调用客户端的可调用对象,把准备好的参数传递过去
    result = application(environ, start_response)

    # 处理得到的结果,这里简单地把结果输出到标准输出。
    try:
        for data in result:
            if data:    # don‘t send headers until body appears
                write(data)
    finally:
        if hasattr(result, ‘close‘):
            result.close()

中间层 middleware

有些程序可能处于服务器端和程序端两者之间:对于服务器程序,它就是应用程序;而对于应用程序,它就是服务器程序。这就是中间层 middleware。middleware 对服务器程序和应用是透明的,它像一个代理/管道一样,把接收到的请求进行一些处理,然后往后传递,一直传递到客户端程序,最后把程序的客户端处理的结果再返回。如下图所示:

相关: http://stackoverflow.com/questions/1303118/looking-for-a-diagram-to-explain-wsgi

http://www.python.org/dev/peps/pep-0333/

一图胜千言, 一图胜千言

middleware 做了两件事情:

  1. 被服务器程序(有可能是其他 middleware)调用,返回结果回去
  2. 调用应用程序(有可能是其他 middleware),把参数传递过去

PEP 333 上面给出了 middleware 的可能使用场景:

  • 根据 url 把请求给到不同的客户端程序(url routing)
  • 允许多个客户端程序/web 框架同时运行,就是把接到的同一个请求传递给多个程序。
  • 负载均衡和远程处理:把请求在网络上传输
  • 应答的过滤处理

那么简单地 middleware 实现是怎么样的呢?下面的代码实现的是一个简单地 url routing 的 middleware:

class Router(object):
    def __init__(self):
        self.path_info = {}
    def route(self, environ, start_response):
        application = self.path_info[environ[‘PATH_INFO‘]]
        return application(environ, start_response)
    def __call__(self, path):
        def wrapper(application):
            self.path_info[path] = application
        return wrapper

router = Router()

怎么在程序里面使用呢?

#here is the application
@router(‘/hello‘)	#调用 route 实例,把函数注册到 paht_info 字典
def hello(environ, start_response):
    status = ‘200 OK‘
    output = ‘Hello‘
    response_headers = [(‘Content-type‘, ‘text/plain‘),
                        (‘Content-Length‘, str(len(output)))]
    write = start_response(status, response_headers)
    return [output]

@router(‘/world‘)
def world(environ, start_response):
    status = ‘200 OK‘
    output = ‘World!‘
    response_headers = [(‘Content-type‘, ‘text/plain‘),
                        (‘Content-Length‘, str(len(output)))]
    write = start_response(status, response_headers)
    return [output]

#here run the application
result = router.route(environ, start_response)
for value in result:
    write(value)

注:上面的代码来自这篇博客

了解更多?

对于普通的开发者来说,了解到上面的知识已经足够,并不需要掌握每一个细节。

Only authors of web servers and programming frameworks need to know every detail and corner case of the WSGI design. You don’t need to understand every detail of WSGI just to install a WSGI application or to write a web application using an existing framework.

想要更多的话,就去看 PEP333,文档里还有下面更多的知识:

  • 错误处理
  • environ 变量包含哪些值,都是什么意思。
  • 输入和输出的细节
  • start_response 的更多规范
  • content-length 等头部规范
  • 缓存和文本流
  • unicode 和多语言处理
  • ……

参考资料

时间: 2024-10-30 13:06:33

(转载-学习)python wsgi 简介的相关文章

Python 学习笔记13:Python + wsgi + django 配置。坑爹的python3和wsgi不兼容的解决

今人不见古时月,今月曾经照古人.生命是如此的美丽与短暂! 学习Python已经两个月了,Python的语法通过做简单的语法题和看Python语法介绍,有了初步的了解.但上班还是要做别的事情,所以感觉学起来特别慢.有一种时不我待的感觉. 基本的语法了解了,接下来就要尽快进入到项目的实战.这样才能快速的遇到问题,并解决问题,迅速提升能力. 开始当然就是先按网上的一般步骤,用django写个博客网站出来. 接下来就是血泪啊!配置这个Python + wsgi + django, 其恶心已达到足以让我呕

《转载》为什么我要在2018年学习Python?

本文转载自36kr 从网页编程到时髦的人工智能,机器学习,这个享有"瑞士军刀(万能工具)"盛誉的Python语言, 你学会了吗? 编者注: 根据维基百科的解释,"Python是一种广泛使用的高级编程语言,由吉多·范罗苏姆创造,第一版发布于 1991 年.Python 的设计哲学强调了代码的可读性和简洁的语法." 随着大数据,人工智能的兴起,越来越多的人也开始研究起这门语言.以下这篇文章编译自Alexus Strong 在在线学习编程网站Codecademy 上发表的

Python学习系列 (第一章):Python 的简介

一: Python 的简介: python的创始人为吉多·范罗苏姆(Guido van Rossum).1989年的圣诞节期间,吉多·范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解释程序,作为ABC语言的一种继承. 二:Python的应用领域: web 开发: Django\pyramid\Tornado\Bottle\Flask\WebPy 网络编程: twisted\Requests\scrapy\paramiko 科学运算: Scipy\pandas\lpython GUI图形开

Python的简介与入门

Python的简介与入门 ·Python是一种结合了解释.性编译性.互动性和面向对象多种特性的脚本语言.对于编程初学者而言,Python易于阅读与学习,并且支持广泛的应用程序的开发与拥有支持多种平台的广泛的基础数据库. ·安装Python在Windows环境下  1.进入Python 官方网站:https://www.python.org/                 2.点击Downloads==> Downloads for Windows==> Python 3.6.2  3.下载安

python培训之零基础如何学习python?

老男孩python培训教你如何零基础学python 根据TIOBE最新排名,Python已超越C#,与Java,C,C++成为全球前5大流行编程语言之一.从云端.客户端,到物联网终端,python应用无处不在.从国内的百度.阿里.腾讯.网易.新浪,豆瓣,到国外的谷歌.NASA.YouTube.Facebook,Python的企业需求逐步上升,各公司都在大规模使用Python完成各种任务相对于其他语言,它更加易学.易读,非常适合快速开发.Python编程简单直接,难度低于java,更适合初学编程者

学习Python编程的11个精品资源

本文由 伯乐在线 - atupal 翻译自 Alex Ivanovs.欢迎加入技术翻译小组.转载请参见文章末尾处的要求. 用 Python 写代码并不难,事实上,它一直以来都是被声称为最容易学习的编程语言.如果你正打算学习 web 开发,Python 是一个不错的选择,甚至你想学游戏开发也可 以从 Python 开始,因为用 Python 来构建游戏的资源实在是太多了.这是一种快速 学习语言的一种方法. 许多程序员使用 Python 作为初学语言,然后接着是像 PHP 和 Ruby 这样的语言.

(四)Openstack学习之WSGI:自己动手写例子

WSGI 是Web Services Gateway Interface的缩写. 如果想深入了解,可以阅读 PEP 333 文档,包含有任何你想要的:)community errata, .这篇文章将手把手教你写一个简单的WSGI例子. 注意:我用的Python版本是.2.7.x. 最经典,最简答的WSGI样当属 Hello World app. 咱们将要用到 virtualenv 去创建一个封闭的Python项目环境: $ virtualenv wsgi-example $ cd wsgi-e

KVM虚拟化学习总结之简介

KVM虚拟化学习总结之简介 1.虚拟化分为:全虚拟化和半虚拟化,需要CPU的支持. 2.全虚拟化:不需要做任何配置,让用户觉得就是一台真实的服务器 3.半虚拟机化:需要用户配置,有点麻烦. 4.KVM 仅仅是 Linux 内核的一个模块.管理和创建完整的 KVM 虚拟机,需要更多的辅助工具. 5.与Xen相比较,KVM就简化的多了.它不需要重新编译内核,也不需要对当前kernel做任何修改,它只是几个可以动态加载的.ko模块.它结构更加精简.代码量更小.所以,出错的可能性更小.并且在某些方面,性

Python正则表达式简介

Python正则表达式简介 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 就其本质而言,正则表达式(或RE模块)是一种小型的,高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过re模块实现.正则表达式模式被编译成一系列的字节码,然后由C编写的匹配引擎执行. 原文地址:https://www.cnblogs.com/yinzhengjie/p/8542361.html