响应内容 我们能读取服务器响应的内容。再次以 GitHub 时间线为例: >>> import requests >>> r = requests.get(‘https://api.github.com/events‘) >>> r.text u‘[{"repository":{"open_issues":0,"url":"https://github.com/... Requests 会自动解码来自服务器的内容。大多数 unicode 字符集都能被无缝地解码。 请求发出后,Requests 会基于 HTTP 头部对响应的编码作出有根据的推测。 当你访问 r.text 之时,Requests 会使用其推测的文本编码。你可以找出 Requests 使用了什么编码,并且能够使用 r.encoding 属性来改变它: >>> r.encoding #返回编码格式 ‘utf-8‘ >>> r.encoding = ‘ISO-8859-1‘ #设置编码格式 如果你改变了编码,每当你访问 r.text ,Request 都将会使用 r.encoding 的新值。 你可能希望在使用特殊逻辑计算出文本的编码的情况下来修改编码。 比如 HTTP 和 XML 自身可以指定编码。这样的话,你应该使用 r.content 来找到编码,然后设置 r.encoding 为相应的编码。这样就能使用正确的编码解析 r.text 了。 ---------------------------------------------------------------------------- import requests response = requests.get("https://www.baidu.com") print(response.url) #返回请求的url:https://www.baidu.com/ print(response.status_code) #获取响应状态码:200 print(response.encoding) #返回当前的编码格式:ISO-8859-1 response.encoding = ‘utf-8‘ #设置编码格式 print(response.encoding) #返回:utf-8 说明上一步设置成功 print(response.content) #返回:b‘<!DOCTYPE html>\r\n<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8> <meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer> 执行结果: https://www.baidu.com/ 200 ISO-8859-1 utf-8 b‘<!DOCTYPE html>\r\n<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8> <meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer> =============================================================================================================================
原文地址:https://www.cnblogs.com/xiaobaibailongma/p/12339895.html
时间: 2024-10-18 20:07:52