Beautiful Soup 库基础知识

1.安装

cmd------->>pip install beautifulsoup4

2.安装测试。

import requests                        # 导入requests库
from bs4 import BeautifulSoup          # 导入美味汤库

r = requests.get("http://python123.io/ws/demo.html")
print(r.status_code)                  # 测试是否连接正常
# print(r.text)                       # 全部文本信息

demo = r.text                              # 赋值,方便后期处理

soup = BeautifulSoup(demo,"html.parser")   # 开始煲汤   demo 为解析对象。   html.parser 为解析方式

print(soup.prettify())                     # 友好显示结果

煲汤过程可以总结为:

from bs4 import BeautifulSoup                         # B and S 大写
soup = BeautifulSoup ("<p>date</p>","html.parser")    # <p>date</p> 解析对象   "html.parser" 解析器 

3. BeautifulSoup 的基本元素。

import requests                     #
r = requests.get("http://python123.io/ws/demo.html")
demo = r.text

from bs4 import BeautifulSoup
soup = BeautifulSoup(demo,"html.parser")

# tag
print(soup.a)
print(soup.p)
print(soup.a.prettify())   # 标签内容的友好显示
print(soup.p.prettify())   # 标签内容的友好显示

# name
print(soup.a.name)
print(soup.p.name)

# string
print(soup.a.string)
print(soup.p.string)

# 属性
print(soup.a.attrs)
print(soup.p.attrs)

3.1 Tag标签

import requests                    from bs4 import BeautifulSoup
r = requests.get("http://python123.io/ws/demo.html")
demo = r.text 

soup = BeautifulSoup(demo,"html.parser")
tag = soup.a
print(tag)      #a tag               # <a class="py1" href="http://www.icourse163.org/course/BIT-268001" id="link1">Basic Python</a># 标签。最基本的信息组织单元,别用 <> 和 </> 表明开头和结尾。

3.2 标签的名字

3.3 标签的属性 (不懂有什么用)

3.4 标签的字符串

print(soup.a.string)                                              # Basic Python
print(soup.p.string)                                              # The demo python introduces several python courses.
print(type(soup.p.string))                                        # <class ‘bs4.element.NavigableString‘>

3.5  注释。

demo,"html.parser"
时间: 2024-12-24 11:38:29

Beautiful Soup 库基础知识的相关文章

Python网络爬虫与信息提取-Beautiful Soup 库入门

一.Beautiful Soup 库的安装 Win平台:"以管理员身份运行" cmd 执行 pip install beautifulsoup4 安装小测:from bs4 import BeautifulSoup soup=BeautifulSoup('<p>data</p>','html.parser') print(soup.prettify()) 二.Beautiful Soup 库的基本元素 1.BeautifulSoup类 from bs4 impo

Python爬虫学习(二)使用Beautiful Soup库

(一)使用Beautiful Soup库 1,安装Beautiful Soup库:pip install beautifulsoup4 2,简单使用: import requests; from _socket import timeout from bs4 import BeautifulSoup #使用Beautiful Soup库需要导包 #from aifc import data def getHTMLText(url): try: r=requests.get(url,timeout

【Python爬虫学习笔记(2)】Beautiful Soup库相关知识点总结

1. Beautiful Soup简介     Beautiful Soup是将数据从HTML和XML文件中解析出来的一个python库,它能够提供一种符合习惯的方法去遍历搜索和修改解析树,这将大大减少爬虫程序的运行时间.     Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码.你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了.然后,你仅仅需要说明一下原始编码方式就可以了.     B

python之Beautiful Soup库

1.简介 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据.官方解释如下: Beautiful Soup提供一些简单的.python式的函数用来处理导航.搜索.修改分析树等功能.它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序. Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码.你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beaut

python beautiful soup库的超详细用法

原文地址https://blog.csdn.net/love666666shen/article/details/77512353 参考文章https://cuiqingcai.com/1319.html 1. Beautiful Soup 简介 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据.官方解释如下: Beautiful Soup提供一些简单的.python式的函数用来处理导航.搜索.修改分析树等功能.它是一个工具箱,通过解析文档为用户提供需要

Python mysql-数据库基础知识

2017-09-05 19:10:55 一.数据库定义 从本质上讲,数据库就是信息的集合,它可以存在很长时间,往往是很多年.一般来讲,"数据库"这个词指的是有数据库管理系统管理的数据的集合.数据库管理系统DBMS将满足: 允许用户使用专门的数据定义语言来创建新的数据库并指定其模式(数据的逻辑结构). 给予用户使用适当的语言来查询数据和修改数据的能力,这种语言通常被称为查询语言(query language). 支持对非常大量的数据进行长期的存储,允许搞笑的存取数据已进行查询和数据修改.

Beautiful Soup 4.2.0 文档

Beautiful Soup 4.2.0 文档 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间. 这篇文档介绍了BeautifulSoup4中所有主要特性,并且有小例子.让我来向你展示它适合做什么,如何工作,怎样使用,如何达到你想要的效果,和处理异常情况. 文档中出现的例子在Python2.7和Python3.2中的执行结果相

Beautiful Soup教程

Python中使用Beautiful Soup库的超详细教程 转 http://www.jb51.net/article/65287.htm 作者:崔庆才 字体:[增加 减小] 类型:转载 时间:2015-04-30我要评论 这篇文章主要介绍了Python中使用Beautiful Soup库的超详细教程,示例代码基于Python2.x版本,极力推荐!需要的朋友可以参考下 1. Beautiful Soup的简介 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓

Beautiful Soup

Beautiful Soup 4.2.0 文档 - Beautiful Soup 4.2.0 documentation Navigation index Beautiful Soup 4.2.0 documentation ? Beautiful Soup 4.2.0 文档? Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.