爬虫-jupyter的使用

一、什么是Jupyter Notebook？

1. 简介

Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算：开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍

简而言之，Jupyter Notebook是以网页的形式打开，可以在网页页面中直接编写代码和运行代码，代码的运行结果也会直接在代码块下显示。如在编程过程中需要编写说明文档，可在同一个页面中直接编写，便于作及时的说明和解释。

2. 组成部分

① 网页应用

网页应用即基于网页形式的、结合了编写说明文档、数学公式、交互计算和其他富媒体形式的工具。简言之，网页应用是可以实现各种功能的工具。

② 文档

即Jupyter Notebook中所有交互计算、编写说明文档、数学公式、图片以及其他富媒体形式的输入和输出，都是以文档的形式体现的。

3. Jupyter Notebook的主要特点

编程时具有语法高亮、缩进、tab补全的功能。
可直接通过浏览器运行代码，同时在代码块下方展示运行结果。
对代码编写说明文档或语句时，支持Markdown语法。

二、安装Jupyter Notebook

1. 安装

① 安装前提

安装Jupyter Notebook的前提是需要安装了Python（3.3版本及以上，或2.7版本）。

② 使用Anaconda安装

如果你是小白，那么建议你通过安装Anaconda来解决Jupyter Notebook的安装问题，因为Anaconda已经自动为你安装了Jupter Notebook及其他工具，还有python中超过180个科学包及其依赖项。

你可以通过进入Anaconda的官方下载页面自行选择下载；如果你对阅读英文文档感到头痛，或者对安装步骤一无所知，甚至也想快速了解一下什么是Anaconda，那么可以前往我的另一篇文章Anaconda介绍、安装及使用教程。你想要的，都在里面！

常规来说，安装了Anaconda发行版时已经自动为你安装了Jupyter Notebook的，但如果没有自动安装，那么就在终端（Linux或macOS的“终端”，Windows的“Anaconda Prompt”，以下均简称“终端”）中输入以下命令安装：

conda install jupyter notebook

③ 使用pip命令安装

如果你是有经验的Python玩家，想要尝试用pip命令来安装Jupyter Notebook，那么请看以下步骤吧！接下来的命令都输入在终端当中的噢！

把pip升级到最新版本

Python 3.x

pip3 install --upgrade pip

Python 2.x

pip install --upgrade pip

注意：老版本的pip在安装Jupyter Notebook过程中或面临依赖项无法同步安装的问题。因此强烈建议先把pip升级到最新版本。

安装Jupyter Notebook

Python 3.x

pip3 install jupyter

Python 2.x

pip install jupyter

三、运行Jupyter Notebook

0. 帮助

如果你有任何jupyter notebook命令的疑问，可以考虑查看官方帮助文档，命令如下：

jupyter notebook --help

或

jupyter notebook -h

1. 启动

① 默认端口启动

在终端中输入以下命令：

jupyter notebook

执行命令之后，在终端中将会显示一系列notebook的服务器信息，同时浏览器将会自动启动Jupyter Notebook。

启动过程中终端显示内容如下：

$ jupyter notebook
[I 08:58:24.417 NotebookApp] Serving notebooks from local directory: /Users/catherine
[I 08:58:24.417 NotebookApp] 0 active kernels
[I 08:58:24.417 NotebookApp] The Jupyter Notebook is running at: http://localhost:8888/
[I 08:58:24.417 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).

注意：之后在Jupyter Notebook的所有操作，都请保持终端不要关闭，因为一旦关闭终端，就会断开与本地服务器的链接，你将无法在Jupyter Notebook中进行其他操作啦。

浏览器地址栏中默认地将会显示：http://localhost:8888。其中，“localhost”指的是本机，“8888”则是端口号。

URL

如果你同时启动了多个Jupyter Notebook，由于默认端口“8888”被占用，因此地址栏中的数字将从“8888”起，每多启动一个Jupyter Notebook数字就加1，如“8889”、“8890”……

② 指定端口启动

如果你想自定义端口号来启动Jupyter Notebook，可以在终端中输入以下命令：

jupyter notebook --port <port_number>

其中，“<port_number>”是自定义端口号，直接以数字的形式写在命令当中，数字两边不加尖括号“<>”。如：jupyter notebook --port 9999，即在端口号为“9999”的服务器启动Jupyter Notebook。

③ 启动服务器但不打开浏览器

如果你只是想启动Jupyter Notebook的服务器但不打算立刻进入到主页面，那么就无需立刻启动浏览器。在终端中输入：

jupyter notebook --no-browser

此时，将会在终端显示启动的服务器信息，并在服务器启动之后，显示出打开浏览器页面的链接。当你需要启动浏览器页面时，只需要复制链接，并粘贴在浏览器的地址栏中，轻按回车变转到了你的Jupyter Notebook页面。

例图中由于在完成上面内容时我同时启动了多个Jupyter Notebook，因此显示我的“8888”端口号被占用，最终分配给我的是“8889”。

2. 快捷键

向上插入一个cell：a
向下插入一个cell：b
删除cell：x
将code切换成markdown：m
将markdown切换成code：y
运行cell：shift+enter
查看帮助文档：shift+tab
自动提示：tab

3. 魔法指令

运行外部python源文件：%run xxx.py
计算statement的运行时间:%time statement
计算statement的平均运行时间:%timeit statement
测试多行代码的平均运行时间：

%%timeit

statement1

statement2

statement3

原文地址：https://www.cnblogs.com/sunxiuwen/p/10112055.html

时间： 2024-10-20 04:38:26

爬虫-jupyter的使用

一、什么是Jupyter Notebook？

2. 组成部分

3. Jupyter Notebook的主要特点

二、安装Jupyter Notebook

1. 安装

三、运行Jupyter Notebook

0. 帮助

1. 启动

① 默认端口启动

② 指定端口启动

③ 启动服务器但不打开浏览器

2. 快捷键

3. 魔法指令

爬虫-jupyter的使用的相关文章

爬虫-Jupyter Notebook使用

爬虫介绍+Jupyter Notebook

爬虫获取mobike共享单车信息

爬虫：工作中编写的一个python爬取web页面信息的小demo

爬虫实战：爬虫之 web 自动化终极杀手 ( 上）

爬虫学习1

python爬虫--基本流程

Python爬虫学习记录【内附代码、详细步骤】

python爬虫---->github上python的项目