一小段带html格式的python代码—word发布2

# coding:utf8

?

from bs4 import BeautifulSoup

import re

?

html_doc =
"""

<html><head><title>The Dormouse‘s story</title></head>

<body>

<p class="title"><b>The Dormouse‘s story</b></p>

?

<p class="story">Once upon a time there were three little sisters; and their names were

<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,

<a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and

<a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;

and they lived at the bottom of a well.</p>

?

<p class="story">...</p>

"""

soup = BeautifulSoup(html_doc,‘html.parser‘,from_encoding=‘utf-8‘)

?

print
‘链接‘

links = soup.find_all(‘a‘)

for link in links:

#print link

print link.name, link[‘href‘],link.get_text()

?

print
‘获取单独链接‘

link_code = soup.find(‘a‘,href=‘http://example.com/lacie‘)

print link_code.name, link_code[‘href‘],link_code.get_text()

?

print
‘正则表达式匹配‘

link_code = soup.find(‘a‘, href=re.compile(r"ill"))

#<ctrl+1> 根据re直接import未导入的模块

print link_code.name, link_code[‘href‘],link_code.get_text()

?

print
‘获取p段落文字‘

p_class = soup.find(‘p‘, class_=‘title‘)

print p_class.name,p_class.get_text()

?

yesterday

时间: 2024-11-07 09:36:26

一小段带html格式的python代码—word发布2的相关文章

PEP 8 -- Python代码格式规则

目录 PEP 8 -- Python代码格式规则 概述 教条主义是脑袋瓜中的小妖精 代码布局 缩进 制表符还是空格? 单行最大长度 该在二元运算符的前面还是后面换行 空行 源文件代码编写 导入 模块级双下名称 字符串的引号 表达式和语句中的空格 痛点 其他建议 何时使用收尾逗号 注释 块注释 行内注释 文档字符串 命名规范 最高原则 描述性:命名样式 约定俗成:名称传统 避免使用的名称 ASCII 兼容 包和模块名 类名 Type变量名 异常类名 全局变量名 函数和变量名 函数和方法的参数 方法

写段python代码判断list深度

主要是针对嵌套列表问题.列表套列表,到底子列表那个更深... 这个问题想着就烦.如果嵌套10000万个列表是不是要统计10000个数再排序呢? 最后想了想用 list的extend功能 加上递归函数尝试了一下,代码如下: l1=[1,'a',[1],[2,3,[4,5,[6,7,[7]]]],[2,5,[5,6]],[4],[5],[6]] #l1 = [1, 2, [3, [4, 5], 6, [7, 8,[9, 10], 11], 12], 13] count = 1 def func(l)

没有基础小编带你,用python画机器猫(有代码)

小编带你玩python 没有基础小编带你,用python画机器猫.只需要python3和小编的代码即可.python3小编送,代码文章有,现在就差个你了. 运行不了的找小编,小编包教会你. 重要的事情说三遍: python3小编送,代码文章有. python3小编送,代码文章有. python3小编送,代码文章有. 运行不了的找小编,加Q君羊 八八三四四四一零六. 君羊里的小伙伴和管理员的会这个运行这个源代码.需要学习视频的直接找管理员要,就说是小编让的,烦死她.欢迎小伙伴的加入. 原文地址:h

python代码风格指南:pep8 中文翻译

摘要 本文给出主Python版本标准库的编码约定.CPython的C代码风格参见?PEP7.本文和?PEP 257 文档字符串标准改编自Guido最初的<Python Style Guide>, 并增加了Barry的?GNU Mailman Coding Style Guide的部分内容.本文会随着语言改变等而改变.许多项目都有自己的编码风格指南,冲突时自己的指南为准. 本文给出主Python版本标准库的编码约定.CPython的C代码风格参见PEP7. 本文和PEP 257 文档字符串标准改

python操作word(改课文格式)【最终版】

python操作word的一些方法,前面写了一些感悟,有点跑题,改了下题目,方便能搜索到.心急的可以直接拉到最后看代码,我都加了比较详细的注释. 从8.3号早上9点,到8.8号下午5点半下班,终于把这个python代码写出来了,这五天简直是废寝忘食(扯淡),每天查资料到半夜2点(其实是天太热,洗完澡又晾干就要一个多小时了,在这里吐槽下今年的夏天,2016年北京的7月份简直了,平生第一次长痱子,连去年都没用过的凉席都翻出来了). 好吧,扯得有点远了.因为工作需要,要批量修改一批rtf文件里的文字格

python代码调试

http://blog.csdn.net/pipisorry/article/details/45190851 trace模块可以监控Python执行程序的方式,同时生成一个报表来显示程序的每一行执行的次数.这些信息可以用来发现未被自动化测试集所覆盖的程序执行路径,也可以用来研究程序调用图,进而发现模块之间的依赖关系.编写并执行测试可以发现绝大多数程序中的问题,Python使得debug工作变得更加简单,这是因为在大部分情况下,Python都能够将未被处理的错误打印到控制台中,我们称这些错误信息

十分钟的Python代码知识点总结

#-- 寻求帮助:dir(obj) # 简单的列出对象obj所包含的方法名称,返回一个字符串列表help(obj.func) # 查询obj.func的具体介绍和用法 #-- 测试类型的三种方法,推荐第三种if type(L) == type([]):print("L is list")if type(L) == list:print("L is list")if isinstance(L, list):print("L is list") #-

VSCode编辑器编写Python代码

在学习Python的过程中,一直没有找到比较趁手的第三方编辑器,用的最多的还是Python自带的编辑器.由于本人用惯了宇宙第一IDE(Visual Studio),所以当Visual Studio Code出现时,心情有点小激动呢.从我的使用经验出发,可以说VSCode用来写Python真的是再合适不过了,你将体验到丝滑的编程体验和无限扩展的可能.而且,如果你的项目是包含多种语言的,比如Web开发,你不必再开多个编辑器和其他工具,因为这一切都可以在VSCode里完成了. 搭建环境 在VSCode

Python代码分析工具之dis模块

转自:http://hi.baidu.com/tinyweb/item/923d012e8146d00872863ec0  ,格式调整过. 代码分析不是一个新的话题,代码分析重要性的判断比较主观,不同的人有不同的认识.Python是用C来实现的,所以对于Python的性能或代码质量的评估可以通过dis模块获取到对应的字节码指令来进行评估. Python代码是先被编译为Python字节码后,再由Python虚拟机来执行Python字节码(pyc文件主要就是用于存储字节码指令 的).一般来说一个Py