Requests库网络爬虫实战

实例一：京东商品页面的爬取

import requests
url = "https://item.jd.com/100004770237.html"
try:
   r = requests.get(url)
   r.raise_for_status()
   r.encoding = r.apparent_encoding
   print(r.text[:1000])
except:
    print("爬取失败")

实例二：亚马逊商品页面的爬取

import requests
url = "https://www.amazon.cn/dp/B071HXVPXG/ref=lp_659039051_1_2?s=books&ie=UTF8&qid=1580353560&sr=1-2"
try:
   kv = {‘user-agent‘ :‘Mozilla/5.0‘}
   r = requests.get(url , headers = kv)
   r.raise_for_status()
   r.encoding = r.apparent_encoding
   print(r.text[1000:2000])
except:
    print("爬取失败")

实例三：百度360搜索关键词提交

import requests
keyword = "python"
try:
    kv = {‘q‘ : keyword}
    r = requests.get("http://www.so.com/s",params = kv)
    print(r.request.url)
    r.raise_for_status()
    print(len(r.text))
except:
    print("爬取失败")

备注：搜索引擎关键词提交接口

百度的关键词接口：http://www.baidu.com/s?wd=keyword

360的关键词接口：http://www.so.com/s?q=keyword

实例四：网络图片的爬取和存储

import requests
import os
url = "http://img1.3lian.com/2015/w7/97/d/25.jpg"
#设置爬取图片的存储位置及名称，名称可以使用图片原有的名称也可以自定义
root = "E://python//"
path = root + url.split(‘/‘)[-1]
try:
    if not os.path.exists(root):
        os.mkdir(root)
    if not os.path.exists(path):
        r = requests.get(url)
        with open (path , ‘wb‘ ) as f:
            f.write(r.content)
            f.close()
            print("文档保存成功")
    else:
        print("文件已经存在在")
except:
    print("爬取失败")

实例五：IP地址归属地的自动查询

import requests
url = "http://m.ip138.com/ip.asp?ip="
try:
    r = requests.get(url+‘202.204.80.112‘)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[-500:])
except:
    print("爬取失败")

原文地址：https://www.cnblogs.com/py2019/p/12242318.html

时间： 2024-11-05 11:50:04

Requests库网络爬虫实战的相关文章

Python网络爬虫实战案例之：7000本电子书下载（4）

一.前言本文是<Python开发实战案例之网络爬虫>的第四部分:7000本电子书下载网络爬虫-源码框架剖析.配套视频课程详见:51CTO学院. 二.章节目录 3.1 requests-html文件结构3.2 requests-html源码框架3.3 导入依赖库3.4 HTMLSession请求类3.5 HTMLResponse请求响应类3.6 HTML页面结构类三.正文 3.1 requests-html 文件结构 3.2 requests-html源码框架 3.3 导入依赖库 3.4 H

Python网络爬虫实战视频教程

Python网络爬虫实战教程(全套完整版) 课程观看地址:http://www.xuetuwuyou.com/course/168课程出自学途无忧网:http://www.xuetuwuyou.com 课程目录:课时1:课程介绍课时2:Python初识课时3:Python语法基础课时4:Python控制流与小实例课时5:答疑环节课时6:Python函数详解课时7:Python模块实战课时8:Python文件操作实战课时9:Python异常处理实战课时10:Python面向对象编程

Python网络爬虫实战案例之：7000本电子书下载（2）

一.前言本文是<Python开发实战案例之网络爬虫>的第二部分:7000本电子书下载网络爬虫开发环境安装部署.配套视频课程详见51CTO学院. 二.章节目录 (1)Python开发环境依赖(2)Python依赖程序安装(3)Requests-html安装(4)Requests-html 源码框架下载(5)Requests-html 开发指导手册三.正文 3.1 Python开发环境依赖 3.2 Python依赖程序安装 3.3 requests-html安装 3.4 requests-ht

Python网络爬虫实战案例之：7000本电子书下载（3）

一.前言本文是<Python开发实战案例之网络爬虫>的第三部分:7000本电子书下载网络爬虫开发实战详解.配套视频课程详见51CTO学院请添加链接描述. 二.章节目录 3.1 业务流程3.2 页面结构分析:目录页3.3 页面结构分析:详情页3.4 页面请求和响应:目录页4.5 页面请求和响应:详情页3.4 三.正文 3.1 业务流程 3.2.1 页面结构分析-目录页 3.2.2 页面结构分析-详情页 3.3 页面请求与解析-目录页 3.4 页面请求与解析-详情页 3.5 文件下载四.未完待

《Python3网络爬虫实战案例（崔庆才著）》中文版PDF下载，附源代码+视频教程

<Python3网络爬虫实战案例(崔庆才著)>中文版PDF下载,附源代码+视频教程,带目录资料下载:https://pan.baidu.com/s/1OzxyHQMLOzWFMzjdQ8kEqQ 原文地址:http://blog.51cto.com/7369682/2330247

Python简单网络爬虫实战—下载论文名称，作者信息（下）

在Python简单网络爬虫实战—下载论文名称,作者信息(上)中,学会了get到网页内容以及在谷歌浏览器找到了需要提取的内容的数据结构,接下来记录我是如何找到所有author和title的 1.从soup中get到data类 soup中提供了select方法来筛选所需的类.该方法使用方法如下: articlename = soup.select('title') 该语句即将soup中所有的title元素放到articlename中.select也有其他用法 articlename = soup.s

Python3网络爬虫实战-24、requests：基本使用

在前面一节我们了解了 Urllib 的基本用法,但是其中确实有不方便的地方.比如处理网页验证.处理 Cookies 等等,需要写 Opener.Handler 来进行处理.为了更加方便地实现这些操作,在这里就有了更为强大的库 Requests,有了它,Cookies.登录验证.代理设置等等的操作都不是事儿. 那么接下来就让我们来领略一下它的强大之处吧. 1 基本使用本节我们首先来了解下 Requests 库的基本使用方法. 1. 准备工作在本节开始之前请确保已经正确安装好了 Requests

2017年最新Python3.6网络爬虫实战案例基础+实战+框架+分布式高清视频教程

课程简介: 这是一套目前为止我觉得最适合小白学习的体系非常完整的Python爬虫课程,使用的Python3.6的版本,用到anaconda来开发python程序,老师讲解的很细致,课程体系设置的也非常棒,完全是从浅入深一点点讲解,从Python爬虫环境的安装开始,讲解了最最基本的urllib包如何使用,如何解析request请求内容,刷选有用数据,像ajax,post,html,json等等都非常细致的一一讲解,然后逐步深入到如何利用cookie,ip代{过}{滤}理池的技术,来解决登陆验证与防

python网络爬虫实战-Scrapy,深入理解scrapy框架，解决数据抓取过程

一前言二网络爬虫简介审查元素简单实例 1 requests安装 2 简单实例三爬虫实战小说下载 1 实战背景 2 小试牛刀 3Beautiful Soup 3整合代码优美壁纸下载 1实战背景 2实战进阶 3整合代码爱奇艺VIP视频下载 1实战背景 2实战升级 3编写代码四总结一前言强烈建议:请在电脑的陪同下,阅读本文.本文以实战为主,阅读过程如稍有不适,还望多加练习. 本文的实战内容有: 网络小说下载(静态网站) 优美壁纸下载(动态网站) 爱奇艺VIP视频下载二