python 总结 常用处理函数

#**整形转ascii!!!**
def intToAscii(size):
  import binascii
  a16=hex(int(size)).lstrip("0x")
  for x in range(len(a16),4):
    a16=‘0‘+a16
  return binascii.b2a_hex(a16)

#**补零!!!**
def addZone(size):
  a8=str(size)
  for x in range(len(str(size)),8):
    a8=str(‘0‘+a8)
  return a8
#**过滤HTML中的标签**
def filter_tags(htmlstr):
    import re
    #先过滤CDATA
    re_cdata=re.compile(‘//<!\[CDATA\[[^>]*//\]\]>‘,re.I) #匹配CDATA
    re_script=re.compile(‘<\s*script[^>]*>[^<]*<\s*/\s*script\s*>‘,re.I)#Script
    re_style=re.compile(‘<\s*style[^>]*>[^<]*<\s*/\s*style\s*>‘,re.I)#style
    re_br=re.compile(‘<br\s*?/?>‘)#处理换行
    re_h=re.compile(‘</?\w+[^>]*>‘)#HTML标签
    re_comment=re.compile(‘<!--[^>]*-->‘)#HTML注释
    s=re_cdata.sub(‘‘,htmlstr)#去掉CDATA
    s=re_script.sub(‘‘,s) #去掉SCRIPT
    s=re_style.sub(‘‘,s)#去掉style
    s=re_br.sub(‘‘,s)#将br转换为换行
    s=re_h.sub(‘‘,s) #去掉HTML 标签
    s=re_comment.sub(‘‘,s)#去掉HTML注释
    #去掉多余的空行
    blank_line=re.compile(‘\n+‘)
    s=blank_line.sub(‘\n‘,s)
    s=replaceCharEntity(s)#替换实体
    return s

#**替换HTML中的实体**
def replaceCharEntity(htmlstr):
    import re
    CHAR_ENTITIES={‘nbsp‘:‘ ‘,‘160‘:‘ ‘,
                ‘lt‘:‘<‘,‘60‘:‘<‘,
                ‘gt‘:‘>‘,‘62‘:‘>‘,
                ‘amp‘:‘&‘,‘38‘:‘&‘,
                ‘quot‘:‘"‘,‘34‘:‘"‘,}

    re_charEntity=re.compile(r‘&#?(?P<name>\w+);‘)
    sz=re_charEntity.search(htmlstr)
    while sz:
        entity=sz.group()#entity全称,如&gt;
        key=sz.group(‘name‘)#去除&;后entity,如&gt;为gt
        try:
            htmlstr=re_charEntity.sub(CHAR_ENTITIES[key],htmlstr,1)
            sz=re_charEntity.search(htmlstr)
        except KeyError:
            #以空串代替
            htmlstr=re_charEntity.sub(‘‘,htmlstr,1)
            sz=re_charEntity.search(htmlstr)
    return htmlstr
#**判断是否设置**
def isset(variable):
  if variable:
    return True
  return False

#时间戳转时间
def date(unixtime, format = ‘%Y-%m-%d %H:%M‘):
  import datetime
  d = datetime.datetime.fromtimestamp(unixtime)
  return d.strftime(format)
#下载http图片 返回图片名称
def downImg(imgUrl):
  import urllib2
  import os
  import uuid
  url = imgUrl
  exten=url.split(‘.‘)
  name ="/var/www/html/downImg/"+str(date(time(), format = ‘%Y%m%d‘))+‘/‘+str(uuid.uuid1())+"."+exten[3]
  fileD="/var/www/html/downImg/"+str(date(time(), format = ‘%Y%m%d‘))+‘/‘
  if not os.path.exists(fileD):  #判断文件夹是否存在
        os.makedirs(fileD)
  #保存文件时候注意类型要匹配,如要保存的图片为jpg,则打开的文件的名称必须是jpg格式,否则会产生无效图片
  conn = urllib2.urlopen(url)
  f = open(name,‘wb‘)
  f.write(conn.read())
  f.close()
  return name

#微秒时间
def microtime() :
  import time
  import math
  return ‘%f %d‘ % math.modf(time.time())
时间: 2024-10-07 18:06:30

python 总结 常用处理函数的相关文章

10个Python set 常用操作函数!

今天为大家带来的内容是10个Python set 常用操作函数!(附带详细解答)文章内容具有不错的参考意义,希望在此能够对各位有所帮助. 集合对象是一组无序排列的可哈希的值,集合成员可以做字典中的键.集合支持用in和not in操作符检查成员,由len()内建函数得到集合的基数(大小), 用 for 循环迭代集合的成员.但是因为集合本身是无序的,不可以为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值. set和dict一样,只是没有value,相当于dic

python中常用的函数与库一

1, collections.deque 在python里如果我们用列表作为队列使用也是可以的,只是当从队尾删除或者增加元素的时候是很快的,但是从队首删除或者增加元素则要慢得多,这是因为在队首进行操作其他的元素都要逐一改变. collections.deque就是为队列设计的,它能迅速得删除或者增加元素,无论是队首还是队尾 >>> from collections import deque >>> queue = deque(["Eric", &qu

python之常用字符串函数

#author:zhouyuname = 'my name is zhouyu' print(name.capitalize())print(name.count('m'))print(name.center(50,'-'))print(name.endswith('zhouyu'))#上面这个方法可以用来判断用户输入的是否为邮箱:@qq.comprint(name.find('n'))#上面这个是去找n的索引,有同学可能会问这个有什么用呢,其实字符也是可以切片的,print(name[name

python+selenium常用javascript函数

1.操作滚动条 js="var q=document.documentElement.scrollTop=10000" driver.execute_script(js) 2.移除属性:时间控件处理 # js = "$('input[id=ECTermOfTrustSart]').removeAttr('readonly')" # 2.jQuery,移除属性 # js = "$('input[id=ECTermOfTrustSart]').attr('re

Python:常用的内置函数

内置方法  说明  __init__(self,...)  初始化对象,在创建新对象时调用  __del__(self)  释放对象,在对象被删除之前调用  __new__(cls,*args,**kwd)  实例的生成操作  __str__(self)  在使用print语句时被调用  __getitem__(self,key)  获取序列的索引key对应的值,等价于seq[key]  __len__(self)  在调用内联函数len()时被调用  __cmp__(stc,dst)  比较两

Python常用功能函数

Python常用功能函数汇总 1.按行写字符串到文件中 import sys, os, time, json def saveContext(filename,*name): format = '^' context = name[0] for i in name[1:]: context = context + format + str(i) context = str(context).replace('(','(').replace(')',')').replace(',',',').re

python—— 文件的打开模式和文件对象方法 &amp; os、os.path 模块中关于文件、目录常用的函数使用方法

引用自"鱼c工作室"     文件的打开模式和文件对象方法  : https://fishc.com.cn/forum.php?mod=viewthread&tid=45279&extra=page%3D1%26filter%3Dtypeid%26typeid%3D403 os.os.path 模块中关于文件.目录常用的函数使用方法: https://fishc.com.cn/forum.php?mod=viewthread&tid=45512&extr

python 迭代器 itertools模块中常用工具函数

迭代器 itertools模块中常用工具函数,提供了接近二十个迭代器工具函数. 原文地址:https://www.cnblogs.com/bcyczhhb/p/11809842.html

《Python数据分析常用手册》一、NumPy和Pandas篇

一.常用链接: 1.Python官网:https://www.python.org/ 2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn 3.数据分析常用库的离线安装包(pip+wheels)(百度云):http://pan.baidu.com/s/1dEMXbfN 密码:bbs2 二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和