Python3网络爬虫实战-4、存储库的安装:PyMySQL、PyMongo、RedisPy、Red

在前面一节我们介绍了几个数据库的安装方式，但这仅仅是用来存储数据的数据库，它们提供了存储服务，但如果想要和 Python 交互的话也同样需要安装一些 Python 存储库，如 MySQL 需要安装 PyMySQL，MongoDB 需要安装 PyMongo 等等，本节我们来说明一下这些库的安装方式。

1.4.1 PyMySQL的安装

在前面一节我们了解了 MySQL 的安装方式，在 Python3 中如果想要将数据存储到 MySQL 中就需要借助于 PyMySQL 来操作，本节我们介绍一下 PyMySQL 的安装方式。

1. 相关链接

2. Pip安装

推荐使用 Pip 安装，命令如下：

pip3?install?pymysql
Python资源分享qun 784758214 ,内有安装包，PDF，学习视频，这里是Python学习者的聚集地，零基础，进阶，都欢迎

执行完命令即可完成安装。

3. 验证安装

为了验证库是否已经安装成功，可以在命令行下测试一下：

$ python3
>>> import pymysql
>>> pymysql.VERSION
(0, 7, 11, None)
>>>

在命令行首先输入 python3，进入命令行模式，输入如上内容，如果成功输出了其版本内容，那么证明 PyMySQL 成功安装，在后文我们会详细介绍 PyMySQL 的使用方法。

1.4.2 PyMongo的安装

在前面我们介绍了 MongoDB 的安装方式，在 Python 中如果想要和 MongoDB 进行交互就需要借助于 PyMongo 库，本节我们来了解一下 PyMongo 的安装方法。

1. 相关链接

2. Pip安装

推荐使用 Pip 安装，命令如下：


pip3 install pymongo

运行完毕之后即可完成 PyMongo 的安装。

3. 验证安装

为了验证库是否已经安装成功，可以在命令行下测试一下：

$ python3
>>> import pymongo
>>> pymongo.version
‘3.4.0‘
>>>

在命令行首先输入 python3，进入命令行模式，输入如上内容，如果成功输出了其版本内容，那么证明 PyMongo 成功安装，在后文我们会详细介绍 PyMongo 的使用方法。

1.4.3 RedisPy的安装

对于 Redis 来说，我们要使用 RedisPy 库来与其交互，本节我们来介绍一下 RedisPy 的安装方法。

1. 相关链接

GitHub：https://github.com/andymccurd...
官方文档：https://redis-py.readthedocs.io/

2. Pip安装

推荐使用 Pip 安装，命令如下：

pip3?install?redis
Python资源分享qun 784758214 ,内有安装包，PDF，学习视频，这里是Python学习者的聚集地，零基础，进阶，都欢迎

运行完毕之后即可完成 RedisPy 的安装。

3. 验证安装

为了验证库是否已经安装成功，可以在命令行下测试一下：

$ python3
>>> import redis
>>> redis.VERSION
(2, 10, 5)
>>>

在命令行首先输入 python3，进入命令行模式，输入如上内容，如果成功输出了其版本内容，那么证明 RedisPy 成功安装，在后文我们会详细介绍 RedisPy 的使用方法。

1.4.4 RedisDump的安装

RedisDump 是一个用于 Redis 数据导入导出的工具，是基于 Ruby 实现的，所以要安装 RedisDump 需要先安装Ruby。

1. 相关链接

GitHub：https://github.com/delano/red...
官方文档：http://delanotes.com/redis-dump

2. 安装Ruby

brew?install?ruby

3. Gem安装

安装完成之后，我们就可以执行 gem 命令了，它类似于 Python 中的 pip 命令，利用 gem 我们可以安装 RedisDump，命令如下：

gem?install?redis-dump

执行完毕之后即可完成 RedisDump 的安装。

4. 验证安装

安装成功后就可以执行如下两个命令：

redis-dump
redis-load
Python资源分享qun 784758214 ,内有安装包，PDF，学习视频，这里是Python学习者的聚集地，零基础，进阶，都欢迎

在命令行下输入这两个命令，如果可以成功调用，则证明安装成功。

原文地址：https://blog.51cto.com/14445003/2424615

时间： 2024-10-16 10:35:51

Python3网络爬虫实战-4、存储库的安装:PyMySQL、PyMongo、RedisPy、Red的相关文章

Python3网络爬虫实战-3、数据库的安装：MySQL、MongoDB、Redis

抓取下网页代码之后,下一步就是从网页中提取信息,提取信息的方式有多种多样,可以使用正则来提取,但是写起来会相对比较繁琐.在这里还有许多强大的解析库,如 LXML.BeautifulSoup.PyQuery 等等,提供了非常强大的解析方法,如 XPath 解析.CSS 选择器解析等等,利用它们我们可以高效便捷地从从网页中提取出有效信息. 本节我们就来介绍一下这些库的安装过程. 1.2.1 LXML的安装 LXML 是 Python 的一个解析库,支持 HTML 和 XML 的解析,支持 XPath

《Python3网络爬虫实战案例（崔庆才著）》中文版PDF下载，附源代码+视频教程

<Python3网络爬虫实战案例(崔庆才著)>中文版PDF下载,附源代码+视频教程,带目录资料下载:https://pan.baidu.com/s/1OzxyHQMLOzWFMzjdQ8kEqQ 原文地址:http://blog.51cto.com/7369682/2330247

Python3网络爬虫实战-10、爬虫框架的安装：PySpider、Scrapy

我们直接用 Requests.Selenium 等库写爬虫,如果爬取量不是太大,速度要求不高,是完全可以满足需求的.但是写多了会发现其内部许多代码和组件是可以复用的,如果我们把这些组件抽离出来,将各个功能模块化,就慢慢会形成一个框架雏形,久而久之,爬虫框架就诞生了. 利用框架我们可以不用再去关心某些功能的具体实现,只需要去关心爬取逻辑即可.有了它们,可以大大简化代码量,而且架构也会变得清晰,爬取效率也会高许多.所以如果对爬虫有一定基础,上手框架是一种好的选择. 本书主要介绍的爬虫框架有PySpi

Python3网络爬虫实战-23、使用Urllib：分析Robots协议

利用 Urllib 的 robotparser 模块我们可以实现网站 Robots 协议的分析,本节我们来简单了解一下它的用法. 1. Robots协议 Robots 协议也被称作爬虫协议.机器人协议,它的全名叫做网络爬虫排除标准(Robots Exclusion Protocol),用来告诉爬虫和搜索引擎哪些页面可以抓取,哪些不可以抓取.它通常是一个叫做 robots.txt 的文本文件,放在网站的根目录下. 当搜索爬虫访问一个站点时,它首先会检查下这个站点根目录下是否存在 robots.tx

Python3网络爬虫实战-25、requests：高级用法

在前面一节我们了解了 Requests 的基本用法,如基本的 GET.POST 请求以及 Response 对象的用法,本节我们再来了解下 Requests 的一些高级用法,如文件上传,代理设置,Cookies 设置等等. 1. 文件上传我们知道 Reqeuests 可以模拟提交一些数据,假如有的网站需要我们上传文件,我们同样可以利用它来上传,实现非常简单,实例如下: import requests files = {'file': open('favicon.ico', 'rb')} r =

Python3网络爬虫实战-32、数据存储：关系型数据库存储:MySQL

关系型数据库基于关系模型的数据库,而关系模型是通过二维表来保存的,所以它的存储方式就是行列组成的表,每一列是一个字段,每一行是一条记录.表可以看作是某个实体的集合,而实体之间存在联系,这就需要表与表之间的关联关系来体现,如主键外键的关联关系,多个表组成一个数据库,也就是关系型数据库. 关系型数据库有多种,如 SQLite.MySQL.Oracle.SQL Server.DB2等等. 在本节我们主要介绍 Python3 下 MySQL 的存储. 在 Python2 中,连接 MySQL 的库大多是

Python3网络爬虫实战-33、数据存储：非关系型数据库存储:MongoDB

NoSQL,全称 Not Only SQL,意为不仅仅是 SQL,泛指非关系型的数据库.NoSQL 是基于键值对的,而且不需要经过 SQL 层的解析,数据之间没有耦合性,性能非常高. 非关系型数据库又可以细分如下: 键值存储数据库,代表有 Redis, Voldemort, Oracle BDB 等. 列存储数据库,代表有 Cassandra, HBase, Riak 等. 文档型数据库,代表有 CouchDB, MongoDB 等. 图形数据库,代表有 Neo4J, InfoGrid, Inf

Python3网络爬虫实战-6、APP爬取相关库的安装：Charles的安装

除了 Web 网页,爬虫也可以对 APP 的数据进行抓取,APP 中的页面要加载出来,首先需要获取数据,那么这些数据一般是通过请求服务器的接口来获取的,由于 APP 端没有像浏览器一样的开发者工具直接比较直观地看到后台的请求,所以对 APP 来说,它的数据抓取主要用到一些抓包技术. 本书介绍的抓包工具有 Charles.MitmProxy.MitmDump,APP 一些简单的接口我们通过 Charles 或 MitmProxy 分析找出规律就可以直接用程序模拟来抓取了,但是如果遇到更复杂的接口我

Python3网络爬虫实战-11、爬虫框架的安装：ScrapySplash、ScrapyRedis

ScrapySplash的安装 ScrapySplash 是一个 Scrapy 中支持 JavaScript 渲染的工具,本节来介绍一下它的安装方式.ScrapySplash 的安装分为两部分,一个是是 Splash 服务的安装,安装方式是通过 Docker,安装之后会启动一个 Splash 服务,我们可以通过它的接口来实现 JavaScript 页面的加载.另外一个是 ScrapySplash 的 Python 库的安装,安装之后即可在 Scrapy 中使用 Splash 服务. 1. 相关链