Requests库为python的外部库,话不多话,直接开干吧!
首先是安装requests库,很简单不说了。
文件,引入requests库:
import requests
下面来看一个简单的例子吧:
#一个最简单的爬虫小程序,这里只到获得源html文件结束
import requestsurl1="https://live.500.com/" #ISO-8859-1url2="https://www.baidu.com/" #ISO-8859-1url3="https://study.163.com/course/introduction.htm?courseId=1209448892#/courseDetail?tab=1" #UTF-8url4="http://www.cwl.gov.cn/kjxx/ssq/kjgg/" #ISO-8859-1re=requests.get(url3)if re.status_code==200: #如果请求成功,那返回的状态码就是200。 #表示请求成功,可以继续往下面走 # print(re.text) #可能会有乱码,因为编码的问题 # print(re.encoding) #得到字符编码UTF-8 or ISO-8859-1 if re.encoding=="ISO-8859-1": #如果是这个编码的话,字集应该是gb2312,就要转一下码,不然会有中文乱码问题 html=re.text.encode("ISO-8859-1").decode("GBK") #先编码,再解码 else: html=re.text #utf-8,这个直接用,没有中文乱码问题 print(html)else: #请求不成功。 print("访问失败,换个URL试吧!") #_________________________________________________________________________________________
re.text #返回的是字符类型re.content #返回的是字节类型,这一类用于图片啊,声音啊,视频等
上面的例子是requests库发出的一个get请求,也可以发送一个post请求:re=requests.post(url3,data={"key":"value"}) #参数跟一个字典即可。还有几个http请求如下:
re = requests.put(‘http://www.baidu.com‘, data = {‘key‘:‘value‘}) re = requests.delete(‘baidu.com‘) re = requests.head(‘www.baidu.com‘) re = requests.options(‘http://www.sina.com.cn‘) 未完待续...
原文地址:https://www.cnblogs.com/yiyea/p/11441107.html
时间: 2024-10-03 10:04:29