python3 网址路径中带中文的处理办法

由于python目前不能直接处理中文路径，必须要转化一下，如下例子是下载图片（名字为中文的）：

def getInfo(self,imageurl):
        response = urllib.request.urlopen(imageurl).read().decode(‘utf-8‘)
#         with open("text1.txt",‘w‘,encoding=‘utf-8‘) as file:
#             file.write(response)
#         file.close()
        imageRe = re.compile(r‘<a href=\"(.+)\" title‘)
        for image in imageRe.findall(response):
            pattern = re.compile(r‘^(http://.+/)(.+[jpg|JPG])$‘)
            matchUrl = pattern.match(image)
            if matchUrl:
                ‘由于Python不能解析中文路径，所以quote一下中文字符‘
                imagePath = urllib.parse.urljoin(matchUrl.group(1), urllib.parse.quote(matchUrl.group(2)))
                self.count =self.count+1
                path = matchUrl.group(2)
                print(imageurl)
                print(image)
                ‘save picture‘
                urllib.request.urlretrieve(imagePath, path)

def getLink(self,url):
        response = urllib.request.urlopen(url).read().decode(‘utf-8‘)
        linkRe = re.compile(r‘href="(http://.+\d+)" title=‘)
        for link in linkRe.findall(response):
            self.getInfo(link)
#         with open("text.txt",‘w‘,encoding=‘utf-8‘) as file:
#             file.write(response)
#         file.close()

python3 网址路径中带中文的处理办法

时间： 2024-09-30 19:48:26

python3 网址路径中带中文的处理办法的相关文章

WP8_UTF8 to GB2312转码 (url网址中带中文字符的处理)

直接使用例如:http://www.abc.php?name=中文符 ,客户端调用,在服务端修改后,会出现乱码, 而windows phone 又不能直接支持gb2312, 经过大量分析和验证,发现凡事经过"从汉字转换到16进制"后, 即可成功实现转码,代码如下: string text = "中文符"; string url1 = "http://www.abc.php?name="; string url2 = url1 + Utf8To

python爬虫：解决请求路径中含义中文或特殊字符

一.解决请求路径中含义中文或特殊字符(/n,/t等): 1 httpurl=urllib.parse.quote(new_url, safe=string.printable) 注意:new_url必须是只有一个单引号或者双引号,如果是下面这个既有单引号,也有双引号,就会出现urlerror: new_url='"http://news.sina.com.cn/o/2017-06-08/doc-ifyfzaaq5698972.shtml"'

解决Java工程路径中含有中文的情况

问题: 当Java工程路径中含有中文时,得不到正确的路径 *** 解决: 这其实是编码转换的问题.当我们使用ClassLoader的getResource方法获取路径时,获取到的路径被URLEncoder.encode(path,"utf-8")编码了,当路径中存在中文和空格时,他会对这些字符进行转换,这样,得到的往往不是我们想要的真实路径,所以我们可以调用URLDecoder.decode()方法进行解码,以便得到原始的中文及空格路径. Java代码 : String package

解决python中路径中包含中文无法找到文件的问题

a="C:\Users\Dell\Desktop\ATOU\公共测试用例" (带中文的路径) a=a.decode("utf-8").encode("gbk") (进行转码) import sys sys.path.append(a) (指定路径成功) 合并起来一条: import sys sys.path.append("C:\Users\Dell\Desktop\ATOU\公共测试用例".decode("ut

ios网址解析中，中文部分如何处理

在网络解析中,中文出现的时候,在解析数据是中文会显示为 %E7%81%AB%E5%BD%B1%E5%BF%8D%E8%80%85 这样的形式但是如果我们之间用字符串拼接键值对的时候但多数出现的不是错误数据就是我们不想要的数据,那如何将中文编码成这样的形式呢. 现在介绍一个简单方法 (ios) NSString *srt=@"火影忍者"; NSLog(@"%@",[srt stringByAddingPercentEscapesUsingEncoding:NSUTF

[Liferay6.2]启动Tomcat提示APR不能在java类库路径中被找到的解决办法

问题描述启动liferay之后,在控制台中打印出会打印出以下信息: 信息: The APR based Apache Tomcat Native library which allows optimal performance in production environments was not found on the java.library.path:…… 意思是可让生产环境中达到最佳性能的Apache Tomcat本地库为基础的APR(Apache可移植运行库)不能在java类库路径中

SpringMVC(七) RequestMapping 路径中带占位符的URL

使用方法:在@RequestMapping("/delete/{id}")中,通过{id}带入pathvariable,然后在方法中,通过@PathVariable("变量名称") Iteger id 的方式引入占位符. 控制器代码: package com.tiekui.springmvc.handlers; import org.springframework.stereotype.Controller; import org.springframework.w

PLSQL往表中插入中文乱码解决办法

1.查看服务器端编码:select userenv('language') from dual; 2.查看第一行中PARAMETER项中为NLS_LANGUAGE 对应的VALUE项中是否和第一步得到的值一样:select * from V$NLS_PARAMETERS 3.如果不同,则需要设置环境变量:key:NLS_LANG,value:AMERICAN_AMERICA.AL32UTF8 4.重新启动PLSQL,问题解决.

Python使用urllib时url带中文参数的问题

urllib.request.urlopen(url).read().decode('utf-8') url中带中文参数会出错:UnicodeEncodeError: 'ascii' codec can't encode characters in position 84-86: ordinal not in range(128) 需要对中文进行转码 url = GEOCODE_BASE_URL + urllib.parse.quote('北京市') 文档中对urlib.parse.quote的

猜你喜欢

Web前台直接加载GIS格式数据分析

本文以Flex直接加载Shp.DWG和MDB为例. 首先看一份现估测数据: 1) 加载Shp文件,目前直接由前台Flex代码完成: 图1 在ArcCatalog里面的Shp文件图2 直接在前台加载 ...

转 InnoDB Error Handling

14.20.4 InnoDB Error Handling Error handling in InnoDB is not always the same as specified in the SQ ...

win7访问文件服务器密码错误

1.打开注册表编辑器; 2.定位到HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Lsa; 3.右键新建-DWORD值(32或者64随意): 4 ...

hihocoder 1080 线段树(区间更新)

题目链接:http://hihocoder.com/problemset/problem/1080 , 两种操作的线段树(区间更新). 这道题前一段时间一直卡着我,当时也是基础不扎实做不出来,今天又想 ...

大组合取模之:1<=n<=m<=1e6,1<=p<=1e9

/****************************** 大组合取模之:1<=n<=m<=1e6,1<=p<=1e9 使用:程序最开始调用getprime(),需要 ...

【计算机网络】DHCP：动态主机配置协议

DHCP(Dynamic Host Configuration Protocol,动态主机配置协议)是一个局域网的网络协议,使用UDP协议工作, 主要有两个用途:给内部网络或网络服务供应商自动分配IP ...

linux0.12 编译过程

感谢这篇文章的作者: http://www.cnblogs.com/strugglesometimes/p/4231359.html 编译是个很蛋疼的事情,本想把linux0.12在bochs上 ...

黛玉——活着是为了我心

红楼梦的二十回:黛玉听了宝玉“只许同你玩,替你解闷儿,不过偶然去他那里一趟,就说这话.”听闻这番言语,黛玉甩下一句:“好没意思的话!去不去管我什么事,我又没叫你替我解闷儿.可许你从此不理我呢!”便也不 ...

centos6.x中fstab配置文件出错导致无法启动及忘记root密码解决方法

一.当你修改/etc/fstab配置文件,重启后发现无法进入命令行时,有如下解决方法: 解决办法: 1.启动linux提示失败,输入root账户密码,再次修改/etc/fstab配置文件是会提示rea ...

代码测试中巧用注释

问题描述代码写完后,我们会做一下测试,这时往往需要注释掉一部分代码,并且新增一部分新代码.若该测试在多个文档间进行或同时进行多个测试,就很容易引起混乱,甚至使得恢复原代码出现问题,而一旦出现了问题, ...

一步一步学ios UITextView(多行文本框)控件的用法详解(五5.8)

本文转载至 http://wuchaorang.2008.blog.163.com/blog/static/48891852201232014813990/ 1.创建并初始化创建UITextView ...

ansible学习笔记4-playbooks之task

Task列表每个play包含了一个task列表(任务列表)一个task在其所在对应的所有主机上(通过host pattern匹配的所有主机)执行完毕之后,下一个task才会执行有一点需要明白的是 ...

我的解法: #include <iostream> #include <list> using namespace std; int main() { int i,j,n,m, ...

面localStorage用作数据缓存的简易封装

面localStorage用作数据缓存的简易封装最近做了一些前端控件的封装,需要用到数据本地存储,开始采用cookie,发现很容易就超过了cookie的容量限制,于是改用localStorage,但 ...

how to combine jpg + separate alpha in png?

http://www.tasharen.com/forum/index.php?topic=4018.msg19784#msg19784 I have tons of large sprites, I ...

Hibernate之底层原理的7点整理和总结

开心一笑 [老婆想减肥,让老公帮她买减肥药,老公:吃药伤身,现在挺好,多有肉感啊.儿子:其实真有点胖,老公立刻瞪了儿子一眼:小孩子不知道别乱讲,你妈妈这身材我喜欢.然后,趁老婆不注意狠狠的教训了儿子: ...

了解了这些才能开始发挥jQuery的威力

由于当前jQuery如此的如雷贯耳,相信不用介绍什么是jQuery了,公司代码中广泛应用了jQuery,但我在看一些小朋友的代码时发现一个问题,小朋友们使用的仅仅是jQuery的皮毛,只是使用id选择 ...

iOS开发系列之三 - UITextField 使用方法小结

// 初始化输入框并设置位置和大小 UITextField *textField = [[UITextField alloc] initWithFrame:CGRectMake(10, 100, 30 ...

微信本地开发测试环境

限于微信平台仅限使用外网80端口,开发调试不好同步进行,借助ngrok映射本地端口到外网80端口. 1.下载ngrok 2.修改 ngrok.bat, ngrok -config ngrok.cfg ...

BCB6 调用C# DLL

最近项目涉及第三方接口调用.第三方是用C#实现的WCF服务.而我们的程序是使用的BCB6开发.因此,打算将与WCF的通讯包含在C#的类库中,给BCB6调用.BCB6 是无法直接调用C#的DLL,但可以 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.