Python中escape和unescape

Python处理HTML转义字符

在抓网页数据经常遇到例如>或者 这种HTML转义符，抓到字符串里很是烦人。

　　比方说一个从网页中抓到的字符串

　　p =‘<abc>‘

　　用Python可以这样处理：

import html
p = ‘&lt;abc&gt;‘
txt= html.unescape(p)
print (txt)

　　#这样就得到了txt= ‘<abc>‘

　　如果还想转回去，可以这样：
　　

import cgi
q = cgi.escape(html)
print(q)

#这样又回到了 html = ‘<abc&gt‘

原文地址：https://www.cnblogs.com/logo-88/p/8371583.html

时间： 2024-08-10 19:53:50

Python中escape和unescape的相关文章

javascript中escape()、unescape()、encodeURI()、encodeURIComponent()、decodeUR...

这些URI方法encodeURI.encodeURIComponent().decodeURI().decodeURIComponent()代替了BOM的escape()和unescape()方法.URI方法更可取,因为它们对所有Unicode符号编码,而BOM方法只能对ASCII符号正确编码.尽量避免使用escape()和unescape()方法.摘自 javascript advanced book. js对文字进行编码涉及3个函数:escape,encodeURI,encodeURICom

javascript中escape()、unescape()、encodeURI()、encodeURIComponent()、decodeURI()、decodeURIComponent()比较

js对文字进行编码涉及3个函数:escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decodeURIComponent 1. 传递参数时需要使用encodeURIComponent,这样组合的url才不会被#等特殊字符截断. 例如:<script language="javascript">document.write('<a href="http://passport.bai

Python中读取txt文本出现：SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape问题解决

windows中的路径是反斜杠\,然而反斜杠\在python中有着转义字符的意义,所以在py文件中写windows文件路径的时候,要特别注意反斜杠\的使用. 下面有三种解决方式: 1 # 方式一:转义的方式 2 'c:\\users\xxx\desktop\a.txt' 3 #方式二:显式声明字符串不用转义 4 r'c:\users\xxx\desktop\a.txt' 5 #方式三:使用linux的路径 6 'c:/users/xxx/desktop/a.txt' Python中读取txt文本

Python中escape和unescape

Python中escape和unescape的相关文章

javascript中escape()、unescape()、encodeURI()、encodeURIComponent()、decodeUR...

javascript中escape()、unescape()、encodeURI()、encodeURIComponent()、decodeURI()、decodeURIComponent()比较

Python中读取txt文本出现：SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape问题解决

xls5-解析properties文件，在python中基本没有遇到

python 中正则表达式

正则表达式学习与python中的应用

js中escape对应的C#解码函数 UrlDecode

Python中的文本（一）

第五章 python中正则表达式的使用