自动化运维Python系列(七)之Socket编程

了解知识点TCP\IP

要想理解socket首先得熟悉一下TCP/IP协议族, TCP/IP(Transmission Control Protocol/Internet Protocol)即传输控制协议/网间协议,定义了主机如何连入因特网及数据如何再它们之间传输的标准,

从字面意思来看TCP/IP是TCP和IP协议的合称,但实际上TCP/IP协议是指因特网整个TCP/IP协议族。不同于ISO模型的七个分层,TCP/IP协议参考模型把所有的TCP/IP系列协议归类到四个抽象层中(数据链路层和物理层可以统称为网络接入层)

OSI七层模型和TCP\IP四层参考模型

 

网络协议TCP\IP各层的作用

①     应用层:将一串应用程序产生的数据流传送到传输层

②     传输层:将应用程序的数据截成分组,加上TCP包头形成TCP段,交送网络层TCP UDP

③     网络层:将TCP段加上包括源、目的主机的IP地址和IP报头形成IP数据包,交送数据链路层

IP  ICMP  ARP  RARP

静态路由协议

动态路由协议 RIP(距离向量路由协议) OSPF(开放最短路径优先协议) ISIS(分级链路状态协议,类似OSPF) BGP(边界网关协议)

④     数据链路层:在MAC数据帧的数据部分装上IP数据包,再加上源、目的主机的MAC地址和帧头,根据其目的的MAC地址将帧送到目的主机或者路由

应用层:TFTP,HTTP,SNMP,FTP,SMTP,DNS,Telnet 等等

传输层:TCP,UDP

网络层:IP,ICMP,OSPF,EIGRP,IGMP

数据链路层:SLIP,CSLIP,PPP,MTU

TCP协议三次握手和四次挥手断开

三次握手连接建立阶段

1、客户端发送请求连接报文(SYN=1,seq=client_isn),SYN=1表示请求连接,seq序列号随机生成

2、服务端收到请求后,回复ACK报文,ACK为源seq=client_isc +1,以便回复给客户端后知晓自己的请求得到了回复

3、客户端回复ACK报文确认建立连接,ACK报文为服务端seq=server_isc +1

四次挥手(断开连接过程)

1、假设断开过程由客户端提出,则客户端发送FIN报文,意思说“我的clinet客户端没有数据要发送给你了,我要断开了”,状态变为(FIN_WAIT1)此时应用程序不会立即关闭socket,如果还有数据没传完可以继续传

2、服务端收到FIN报文后,发送ACK,说“你的请求我知道了,但是我还没准备好,请等我消息”此时服务端状态变为(CLOSE_WAIT),客户端收到状态变为(FIN_WAIT2),服务端继续传输数据

3、等服务端忙完了,就会发送FIN报文给客户端,表示“我忙完了,可以断开了”状态变为(LAST_ACK)

4、客户端收到断开FIN报文后,就知道要关闭网络了,但是他还是不太相信网络,就会再次发送一个ACK给服务端,服务端收到以后就知道可以断开了,于是关闭连接;而客户端在等待2MSL(生命周期)大概1~4分钟时间后如果没再收到回复,就会主动关闭SOCKET关闭连接。

Socket

如果两个程序需要通信,我们需要一个能够来唯一标识这两个进程的办法:

本地:本地环境中,我们不需要考虑网络协议直接使用程序PID即可识别出两个不同的程序

网络:在网络环境中,我们可以使用 “IP地址 + 协议 + 端口号” 来区分网络中两个不同的程序

socket是在应用层和传输层之间的一个抽象层,它把TCP/IP层复杂的操作抽象为几个简单的接口供应用层调用已实现进程在网络中通信,通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求

socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)

socket和file的区别:

  • file模块是针对某个指定文件进行【打开】【读写】【关闭】
  • socket模块是针对 服务器端 和 客户端Socket 进行【打开】【读写】【关闭】

python中简单socket通信模型

socket server服务端

#!/usr/bin/env python

# -*- coding:utf-8 -*-

 

import socket

  

# 以元组形式定义一个IP地址和端口

ip_port = (‘127.0.0.1‘,9999)

 

# 创建对象并绑定IP地址 开始监听

sk = socket.socket()

sk.bind(ip_port)

sk.listen(5)

 

# 开始接收消息

while True:

    print ‘server waiting...‘

    # conn 表示客户端与服务端建立连接后的专有通信线路

    conn,addr = sk.accept()  # accept属于阻塞式,没有收到连接请求就不会继续向下运行

 

    # 接收客户端发来的消息

    client_data = conn.recv(1024) # recv也属于阻塞式

    print client_data

    # 回复消息

    conn.sendall(‘收到收到 我是地瓜!‘)

    # 关闭连接

    conn.close()

socket client客户端

import socket

 

ip_port = (‘127.0.0.1‘,9999) sk = socket.socket()sk.connect(ip_port)

    

sk.sendall(‘地瓜地瓜!我是南瓜...‘) 

server_reply = sk.recv(1024)

   

print server_reply

sk.close()

SOCKET模块功能介绍

sk = socket.socket(socket.AF_INET,socket.SOCK_STREAM,0)

#参数一:地址簇
  socket.AF_INET IPv4(默认)  socket.AF_INET6 IPv6
  socket.AF_UNIX 只能够用于单一的Unix系统进程间通信
#参数二:类型
  socket.SOCK_STREAM  流式socket , for TCP (默认)  
  socket.SOCK_DGRAM   数据报式socket , for UDP
  socket.SOCK_RAW 原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;
  其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字
  选项由用户构造IP头。  
  socket.SOCK_RDM 是一种可靠的UDP形式,即保证交付数据报但不保证顺序。
  SOCK_RAM用来提供对原始协议的低级访问,在需要执行某些特殊操作时使用,如发送ICMP报文。
  SOCK_RAM通常仅限于高级用户或管理员运行的程序使用。  
  socket.SOCK_SEQPACKET 可靠的连续数据包服务
#参数三:协议
  0  (默认)与特定的地址家族相关的协议,如果是 0 ,则系统就会根据地址格式和套接类别,
  自动选择一个合适的协议

socket方法

sk.bind(address)

  s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。

sk.listen(backlog)

  开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。

backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5
      这个值不能无限大,因为要在内核中维护连接队列

sk.setblocking(bool)

  是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。

sk.accept()

  接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。

  接收TCP 客户的连接(阻塞式)等待连接的到来

sk.connect(address)

  连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。

sk.connect_ex(address)

  同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061

sk.close()

  关闭套接字

sk.recv(bufsize[,flag])

  接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。

sk.recvfrom(bufsize[.flag])

  与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。

sk.send(string[,flag])

  将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。即:可能未将指定内容全部发送。

sk.sendall(string[,flag])

  将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。

内部通过递归调用send,将所有内容发送出去。

sk.sendto(string[,flag],address)

  将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。

sk.settimeout(timeout)

  设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如 client 连接最多等待5s )

sk.getpeername()

  返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。

sk.getsockname()

  返回套接字自己的地址。通常是一个元组(ipaddr,port)

sk.fileno()

粘包问题

sk.recv(1024)中的1024是bufsize值(链路层协议EthernetII最大传输单元MTU值为1500),表示最大只能传输1024字节的数据,那么如果我们要发送的数据大于1024,server并不会丢弃这些数据,而是暂存在系统内核缓冲区,在下次需要返回结果的时候继续返回上次未完全返回的数据,就会出现在客户端执行一条命令,继续返回上一条命令结果的现象,这就成为粘包

粘包的解决办法

模拟HTTP请求流程

1)客户端请求数据

2)服务端计算返回数据字节数,发送给客户端

3)客户端收到总字节数,随便发出一个 ready 信号,告诉服务端可以开始发送数据

4)服务器发送数据

5)客户端开始多次循环接收,直到所有数据接收完成

socket服务端

import socket

import subprocess

 

ip_port = (‘127.0.0.1‘, 9999)

 

s = socket.socket()

s.bind(ip_port)

s.listen(5)

 

while True:

    conn, addr = s.accept()

  

    while True:

        try:

            recv_data = conn.recv(1024) 

            if str(recv_data, encoding=‘utf-8‘) == ‘exit‘:

                break

            p = subprocess.Popen(str(recv_data, encoding=‘utf-8‘), shell=True, stdout=subprocess.PIPE)

            ret = p.stdout.read()

            if len(ret) == 0:

                send_data = ‘cmd error...‘

                ret = bytes(send_data, encoding=‘utf-8‘)

                conn.send(ret) 

            else:

                ret = str(ret, encoding=‘gbk‘)

                ret = bytes(ret, encoding=‘utf8‘)

                # 返回总字节数给客户端

                read_tag = ‘ready|%s‘ % len(ret)

                conn.send(bytes(read_tag, encoding=‘utf8‘))

                # 确认客户端已经收到

                freedback = conn.recv(1024)

                if str(freedback, encoding=‘utf8‘) == ‘start‘:

                    conn.send(ret)

  

        except Exception:

            break

  

    conn.close()

客户端

import socket

ip_port = (‘127.0.0.1‘, 9999)

   

s = socket.socket()

  

s.connect(ip_port)

   

while True:

    send_data = input(‘>>: ‘).strip()

    if not send_data:

        continue

    else:

        s.send(bytes(send_data, encoding=‘utf-8‘))

        if send_data == ‘exit‘:

            break

        # 解决粘包问题

        ready_tag = s.recv(1024)

        if str(ready_tag, encoding=‘utf8‘).startswith(‘ready‘):

            msg_size = int(str(ready_tag, encoding=‘utf8‘).split(‘|‘)[-1])

            s.send(bytes(‘start‘, encoding=‘utf8‘))

 

            recv_msg = b‘‘

            recv_size = 0

            # 开始循环接收数据

            while recv_size < msg_size:

                recv_data = s.recv(1024)

                recv_msg += recv_data

                recv_size += len(recv_data)

                print(‘MSG_SIZE:{} (RECV:{})‘.format(msg_size, recv_size))

  

            recv_data = str(recv_msg, encoding=‘utf-8‘)

            print(recv_data)

        else:

            print(str(ready_tag, encoding=‘utf8‘))

  

s.close()
时间: 2024-10-10 07:29:24

自动化运维Python系列(七)之Socket编程的相关文章

自动化运维Python系列(一)之基础篇

Python介绍 Python是由创始人吉多·范罗苏姆(Guido van Rossum)在1989年圣诞节假期期间,为了打发时间,构思出来的一个新的脚本解释器.由于Guido在开发Python语言过程中,借鉴了很多ABC语言特性,所有后来包括Guido自己也那么认为,Python语言的前身就是ABC语言. Python是一门面向对象的.动态解释型强定义语言:Python崇尚简洁.优美.清晰,是一门优秀的被广泛使用的语言. 在2015年以前,最流行的Python版本还是2.4,但是由于Pytho

自动化运维Python系列之ForeignKey、relationship联表查询

一对多和多对多 数据库表结构设计是程序项目开发前的重要环节,后期数据库操作都是围绕着这个已经设计好的表结构进行,如果表结构设计有问题,整个程序项目就有存在需要整个推翻重构的风险... 数据库表结构除了简单的单表操作以外,还有一对多.多对多等. 一对多 基于SQLAlchemy我们可以先创建如下结构的2张表,然后来看看具体怎样通过外键ForeignKey或者relationship联表操作 创建表 from sqlalchemy.ext.declarative import declarative

自动化运维Python系列之IO多路复用、SocketServer源码分析

IO多路复用 IO多路复用是指:通过一种机制,可以监视多个描述符,一旦某个系统描述符就绪(一般是读就绪或者写就绪)能够通知程序进行相应的读写操作 实例化例子就是在SocketServer模块中,客户端和服务端建立好连接,此时服务端通过监听conn这条链路,一旦客户端发送了数据,conn链路状态就发生变化,服务端就知道有数据要接收... Linux系统中同时存在select.pull.epoll三种IO多路复用机制 windows中只有select机制 1)select select本质上是通过设

自动化运维Python系列(四)之装饰器和生成器

装饰器 在理解什么事装饰器之前,我们需要理解:函数也是一个对象,可以赋值给变量,通过变量来调用 def f1():     print('2016') d = f1 d() 输出: 2016 那么装饰器的作用就是在不改变原函数的前提下,调用这些函数,并且为函数增加我们需要的新功能. 我们平时在编写好很多独立函数模块以后,突然需要在每个模块内添加一个功能,比如: def f1():     print('F1') def f2():     print('F2') def f3():     pr

自动化运维Python系列之Django进阶操作

FBV && CBV FBV.CBV是Django视图路由处理模型,当用户请求送达路由系统URL后,由其转发给视图view来分析并处理 // FBV    function base views  // CBV    class base views 区别就是一个直接用函数驱动,一个用类驱动,两者在使用上存在一些区别 1)FBV URL中根据路由匹配直接转发给视图中的某一个处理函数 urlpatterns = [     url(r'^home/', views.home), ] 视图函数

自动化运维Python系列之Django信号、缓存操作

Django信号 Django内部提供了一种"信号强度"处理机制,简单理解就是当Django在接收到请求后内部做某些特定操作前发出信号,提醒一些接受者或者做操作,这样的好处就是方便程序定制小功能插件,也是对本身框架的一种节藕操作 1)Django的内置信号 Model signals     pre_init                # django的modal执行其构造方法前,自动触发     post_init               # django的modal执行其构

自动化运维Python系列之消息队列RabbitMQ

RabbitMQ RabbitMQ是一个由erlang开发的AMQP(Advanced Message Queue )的开源实现.AMQP 的出现其实也是应了广大人民群众的需求,虽然在同步消息通讯的世界里有很多公开标准(如 COBAR的 IIOP ,或者是 SOAP 等),但是在异步消息处理中却不是这样,只有大企业有一些商业实现(如微软的 MSMQ ,IBM 的 Websphere MQ 等),因此,在 2006 年的 6 月,Cisco .Redhat.iMatix 等联合制定了 AMQP 的

自动化运维Python系列之Memcache、Redis操作

Memcached Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载.它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态.数据库驱动网站的速度.Memcached基于一个存储键/值对的hashmap.其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信. Memcached安装 wget http://memcached.org/latest tar -zxvf memcach

自动化运维Python系列(六)之面向对象

面向对象编程 面向过程:根据业务逻辑从上到下垒代码 函数式:将某功能代码封装到函数中,以后直接调用,不需要再次编写 面向对象:对函数进行分类和封装,让开发"更快更好更强..." # 像Java和C#等编程语言仅支持面向对象编程,而Python支持函数式编程和面向对象编程混用 面向对象示例 # 函数式编程 def bar():     print('bar')   bar()  # 直接调用函数 # 面向对象编程 class Foo:  # 创建类        def bar(self