通过python将xml文件转换成html文件

#数据类型的转换
def main():    maxwidth = 100  #用于规范字段的长度    print_start()    count=0    while True:        try:            line =input()            if count == 0:                color = ‘lightgreen‘            elif count % 2: #取余                color = ‘white‘            else:                color = ‘lightyellow‘            print_line(line,color,maxwidth)            count += 1        except EOFError:            break    print_end()

maxwidth 用于规范字段的长度,一旦比这个长度长的字段,我们可以通过用省略号来替代后面的内容
count 用于对文件中的颜色的改变,斑马纹的实现。
上面的代码中的print_start(),print_line(),print_end()三个函数是我们自己的设定的函数,代码在后面
print_start() 函数用于输入开头
print_end() 函数用于输入结尾
print_line() 将该行以html的形式输出

def print_start():    print("<table border=‘1‘>")#用于文件的开始头拼接
def print_end():    print("</table>")#用于文件的结尾拼接

上面两个是用来减少函数之间的关联性,虽然在函数中添加print(…)也可以,
但是这样可以更加规范,以后修改也比较容易,对之后的运维提供极大的方便,
通过修改函数,可以将所有的头尾一起修改。

def print_line(line,color,maxwidth):    print("<tr bgcolor=‘{0}‘>".format(color))    fields = extrace_fields(line)    for field in fields:        if not field:            print("<td></td>")        else:            number = field.replace(",","")            #这里把”,“改成”“的意义是为了将数值1,000转换为1000的格式        try:            x = float(number)            print("<td align=‘right‘>{0}</td>33".format(round(x)))        except ValueError:            field =field.title()             ‘‘‘            用于注释            title函数是用来将字符串的首字母大写处理                        str = "this is string example from runoob....wow!!!"            请注意,非字母后的第一个字母将转换为大写字母:            txt = "hello b2b2b2 and 3g3g3g"            print(txt.title())    #Hello B2B2B2 And 3G3G3G            ‘‘‘            field = field.replace(‘And‘,‘and‘)            if len(field) <= maxwidth:                field = escape_html(field)            else:                field = "{0}...".format(                escape_html(field[:maxwidth]))            print("<td>{0}</td>".format(field))    print("</tr>")

这段程序是将通过for遍历文件,提取出里面的值,将里面的值进行规范化 然后通过需要的html格式通过format拼接,最后显示出来。
通过try的异常捕捉,我们可以将文件中的数字与字符串分开处理,数字通过flaot进行小数格式化,字符串通过title格式化
这又体现了python语言通过try捕获异常的灵活性
为什么不再读取的时候直接通过replace进行分割字符串?
因为这是为了防止出现,分号中间有”,“ 使文件不正确分割,导致程序出现错误,所以,我们要在print_line中在进行分割,减少错误的产生
extrace_fields(line)是自定义函数,函数的作用是将字段串进行分割

def extrace_fields(line):    fields =[]    field = ‘‘    quote = None    for c in line:        if c in "\"":                if quote is None:  #start of quoted string                quote = c            elif quote == c: #end of quoted string                quote = None            else:                field += c #other quote inside quoted string            continue         if quote is None and c == ",": #end of a field            fields.append(field)            field =‘‘        else:            field += c  #accumulating a field    if field:        fields.append(field)#adding the last field    return fields
def escape_html(text):    text = text.replace(‘&‘,‘&amp;‘)    text = text.replace(‘<‘,"&lt;")    text = text.replace(">","&gt;")    return text

通过替换函数将‘<‘,‘>‘替换成html可识别的实体字符,不替换的话 html会将‘<‘,‘>‘大于小于符号识别为尖括号<>

原文地址:https://www.cnblogs.com/zjj-tiantian/p/10008894.html

时间: 2024-08-25 01:26:18

通过python将xml文件转换成html文件的相关文章

&lt;p&gt;&lt;span style=&quot;font-size:14px&quot;&gt;近期须要批量将PNM&amp;#26684;式的文件转换成GIF文件。我尝试了例如以下的图像转换工具:&lt;/span&gt;&lt;/p&gt;

近期须要批量将PNM格式的文件转换成GIF文件.我尝试了例如以下的图像转换工具: ImageBatch:全然免费,但只支持PNG JPEG BMP GIF四种格式 OfficeConverter:在线转换软件,支持全部图像格式的相互转换.大量处理图像时须要支付一定费用,否则效率低 Pixillion:支持全部格式,试用版只最多支持5个文件为一组batch的处理,使用100次以后必须付费使用 因为上述工具均不能满足我的须要(不想使用付费软件),我尝试搜索PNM转GIF文件的软件包,发现能够安装Py

在Linux下将HTML文件转换成PDF文件

今天要写一个上交的作业,本来是想用Office Word来写的,但是,我的Office貌似不能用了,但是,Linux下的LibreOffice写出的文档,在打印的时候是经常出现乱码的.所以,后来想到可以 利用HTML写出格式比较好的文档,所以,想到能不能先写出一份比较规范的文档出来,然后转换成PDF文档,因为如果转换成PDF文档,打印,浏览都会比较方便,并且在转换成PDF之后,在打印的时候也不容易出现乱码的现象,经过搜索发现了一个比较不错的html转pdf文件的工具wkhtmltopdf, 在U

如何将一批pdf文件转换成jpg文件

从事设计行业,经常需要从网络上搜集一些图片素材,可是当我们下载的素材是pdf格式的时候,我们该怎么办呢?是不是需要将pdf格式转换成jpg或其它图片格式时才可以加以运用呢?今天小编与大家分享的技巧就是:如何将一批pdf文件转换成jpg文件.    工具/原料  pdf转jpg工具:http://pan.baidu.com/s/1o7ddEcU 方法/步骤  1.首先我们需要从网络上下载一个pdf转jpg工具,同时将它安装在自己的电脑中,并创建快捷方式. 2.双击快捷方式进入工具——选择“pdf图

如何将PDF文件转换成Excel文件,这种方法你绝对没见

PDF文件一直是我们最头疼的文件,这种文件不仅很特殊,而且就连很多公司都不敢使用这种文件,原因就在于这种文件不好编辑,如果想将PDF文件转换成其他格式的文件我们该怎么做呢,下面小编就教大家一个方法! 首先我们要认识一款转换软件--迅捷PDF转换器,很多人肯定都没听说过这种软件,这是一种可以将PDF文件的格式转换成另一种格式的软件,而且转换的速度更加的精准.简单! 打开这款迅捷PDF转换器,在软件的左侧会有很多文件转换的格式,我们选择文件转换成其他格式中的--文件转Excel,然后再点击"添加文件

pdf转换成word转换器免费版是一款功能强大好用的pdf文件转换成word文件的软件

pdf转换成word转换器免费版是一款功能强大好用的pdf文件转换成word文件的软件,界面简单,功能稳定,支持批量转换,操作起来非常方便,支持多种流行文档格式之间转换.完美支持pdf文件转换成word文档,转换后可再次编辑,支持图文混合排版,支持表格转换,支持批量转换,操作简单.pdf转换成word转换器免费不限页数可以很好的转换原来pdf文档中的文字.图片.表格 .超链接.布局,使其转换成的word文档排版与原有文档一样.pdf转换成word转换器是一款小巧.方便且免费的pdf转Word工具

用Java将Excel的xls和xlsx文件转换成csv文件的方法, XLS2CSV, XLSX2CSV

利用poi将excel文件后缀为.xls .xlsx的文件转换成txt/csv文本文件 首先,引入所需的jar包: <dependencies> 2 <dependency> 3 <groupId>net.sf.opencsv</groupId> 4 <artifactId>opencsv</artifactId> 5 <version>2.1</version> 6 </dependency> 7

如何把excel文件转换成pdf文件

我们经常需要将excel文档转换成pdf文件,这是一种最简单.最方便的方法,视频播放地址:http://v.youku.com/v_show/id_XODM2MTk0NzI0.html

15个最好的PDF转word的在线转换器,将PDF文件转换成doc文件

PDF是一种文件格式,包含文本,图像,数据等,这是独立于操作系统的文件类型.它是一个开放的标准,压缩,另一方面DOC文件和矢量图形是由微软文字处理文件.该文件格式将纯文本格式转换为格式化文档.它支持几乎所有的操作系统. PDF和DOC转换期权具体地址的用户想从PDF数据的完美格式编辑Word文档更新文本和图像传输的转换需要. 有无数的工具和服务提供在线执行用户的转换,在这篇文章中,我们已经编制了一份清单15最好的PDF到DOC转换器将帮助您将您的PDF文件,以在各种不同的格式,如xls,RTF,

chm文件转换成html文件,解决chm文件无法使用浏览器打开的问题

CHM是英语“Compiled Help Manual”的简写,即“已编译的帮助文件”.CHM是微软新一代的帮助文件格式,利用HTML作源文,把帮助内容以类似数据库的形式编译储存. CHM文件的好处就是轻量.便捷.只读等,通过目录,能很方便的定位到文件中的各个位置:但是它也有很大的缺陷,就是只能使用特定的阅读器打开,比如微软提供的HTMLHelpWorkshop(系统自带).eTextWizard等.但是我们在使用过程中,会经常遇到需要把CHM文件放到网站上,供用户查看,但是浏览器却不支持CHM

三步学会怎么把pdf文件转换成word文件

PDF怎么转换成word想必是很多朋友烦恼头疼的一件事,虽然软件很多,但是质量普遍不高.专业的转换器是非常少的,其中代表性的软件就要数迅捷PDF转换器了.PDF转word前首先要注意的是,PDF是不是做了保护,如果有密码保护,必须先去除密码后再使用软件来转换.PDF转word之所以受到很多人的欢迎,主要由于PDF文档的不能二次编辑,给工作学习带来很大的不便.现在有了迅捷PDF转换器多少PDF文档都可以轻松转换. 迅捷pdf转换成word转换器是目前来说转换效果最为理想的一款工具,最新技术实现了强